# 印尼語預訓練

Bert Base Indonesian 522M
MIT
基於印尼語維基百科預訓練的BERT基礎模型,採用掩碼語言建模(MLM)目標訓練,不區分大小寫。
大型語言模型 其他
B
cahya
2,799
25
Indobert Lite Base P1
MIT
IndoBERT是針對印尼語的BERT模型變體,採用掩碼語言建模和下一句預測目標訓練。Lite版本是輕量化模型,適用於資源有限環境。
大型語言模型 Transformers 其他
I
indobenchmark
723
0
Indot5 Base
基於印尼語mC4數據集預訓練的T5(文本到文本轉換Transformer)基礎模型,需微調後使用
大型語言模型 Transformers 其他
I
Wikidepia
635
1
Indobert Large P1
MIT
IndoBERT 是基於 BERT 模型的印度尼西亞語先進語言模型,通過掩碼語言建模和下一句預測目標進行訓練。
大型語言模型 其他
I
indobenchmark
1,686
4
Indobert Large P2
MIT
IndoBERT是基於BERT模型針對印尼語開發的尖端語言模型,採用掩碼語言建模(MLM)和下一句預測(NSP)目標進行訓練。
大型語言模型 其他
I
indobenchmark
2,272
8
Bert Base Indonesian 1.5G
MIT
這是一個基於BERT的印尼語預訓練模型,使用維基百科和報紙數據進行訓練,適用於多種自然語言處理任務。
大型語言模型 其他
B
cahya
40.08k
5
Indobert Base P1
MIT
IndoBERT是基於BERT模型的印尼語先進語言模型,採用掩碼語言建模(MLM)和下一句預測(NSP)目標進行訓練。
大型語言模型 其他
I
indobenchmark
261.95k
25
Indonesian Roberta Base
MIT
基於RoBERTa架構的印尼語掩碼語言模型,在OSCAR語料庫上訓練,驗證準確率62.45%
大型語言模型 其他
I
flax-community
1,013
11
Indobert Base P2
MIT
IndoBERT是基於BERT模型的印尼語最先進的語言模型,通過掩碼語言建模和下一句預測目標進行訓練。
大型語言模型 其他
I
indobenchmark
25.89k
5
Indot5 Small
基於印尼語mC4數據集預訓練的T5小型模型,需微調後使用
大型語言模型 Transformers 其他
I
Wikidepia
83
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase