# 維基百科語料

Multilingual Albert Base Cased 128k
Apache-2.0
基於掩碼語言建模(MLM)目標預訓練的多語言ALBERT模型,支持60+種語言,具有參數共享的輕量級架構
大型語言模型 Transformers 支持多種語言
M
cservan
277
2
Multilingual Albert Base Cased 32k
Apache-2.0
基於掩碼語言建模目標預訓練的多語言ALBERT模型,支持50+種語言,區分大小寫
大型語言模型 Transformers 支持多種語言
M
cservan
243
2
Bert Base Arabic
預訓練的阿拉伯語BERT基礎語言模型,支持現代標準阿拉伯語和部分方言
大型語言模型 阿拉伯語
B
asafaya
14.40k
38
Bert Base Indonesian 522M
MIT
基於印尼語維基百科預訓練的BERT基礎模型,採用掩碼語言建模(MLM)目標訓練,不區分大小寫。
大型語言模型 其他
B
cahya
2,799
25
Gpt2 Small Arabic
基於gpt2-small架構訓練的阿拉伯語維基百科數據集GPT2模型,適用於文本生成任務。
大型語言模型 阿拉伯語
G
akhooli
1,066
15
Albert Large Arabic
ALBERT大模型的阿拉伯語預訓練版本,基於約44億詞的阿拉伯語語料訓練
大型語言模型 Transformers 阿拉伯語
A
asafaya
45
1
Japanese Roberta Base
MIT
由rinna株式會社訓練的基礎尺寸日語RoBERTa模型,適用於日語文本的掩碼語言建模任務。
大型語言模型 Transformers 日語
J
rinna
9,375
37
Albert Base Arabic
阿拉伯語ALBERT基礎版是一個預訓練語言模型,基於約44億詞的阿拉伯語數據訓練,支持現代標準阿拉伯語及部分方言內容。
大型語言模型 Transformers 阿拉伯語
A
asafaya
35
0
Gpt2 Small Indonesian 522M
MIT
這是一個基於印尼語維基百科數據預訓練的GPT2-small模型,專注於印尼語文本生成任務。
大型語言模型 其他
G
cahya
1,900
9
Electra Small Japanese Generator
基於日語維基百科預訓練的ELECTRA模型,適用於日語文本處理任務。
大型語言模型 Transformers 日語
E
izumi-lab
16
0
Wangchanberta Base Wiki Newmm
基於泰語維基百科預訓練的RoBERTa BASE模型,適用於泰語文本處理任務
大型語言模型 其他
W
airesearch
115
2
Tinybert General 4L 312D De
這是一個針對德語優化的TinyBERT模型,通過蒸餾BERT基礎cased模型創建,適用於自然語言處理任務。
大型語言模型 Transformers 德語
T
dvm1983
269
3
Slovakbert
MIT
基於斯洛伐克語訓練的預訓練模型,採用掩碼語言建模(MLM)目標,區分大小寫。
大型語言模型 Transformers 其他
S
gerulata
5,009
23
Bert Base Japanese Upos
基於日語維基百科文本預訓練的BERT模型,用於詞性標註和依存句法分析
序列標註 Transformers 支持多種語言
B
KoichiYasuoka
40
2
Bert Base En Tr Cased
Apache-2.0
基於bert-base-multilingual-cased定製的精簡版本,支持英語和土耳其語處理,保持原始模型準確度
大型語言模型 其他
B
Geotrend
21
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase