I

Indobert Large P1

由indobenchmark開發
IndoBERT 是基於 BERT 模型的印度尼西亞語先進語言模型,通過掩碼語言建模和下一句預測目標進行訓練。
下載量 1,686
發布時間 : 3/2/2022

模型概述

IndoBERT 是一個針對印度尼西亞語優化的預訓練語言模型,適用於各種自然語言處理任務。

模型特點

大規模預訓練
使用 Indo4B 數據集(23.43GB 文本)進行預訓練
不區分大小寫
模型處理文本時不區分大小寫
兩階段訓練
模型經過兩個階段的訓練過程(P1 和 P2)

模型能力

文本表示學習
語言理解
文本分類
問答系統
命名實體識別

使用案例

自然語言處理
文本分類
對印度尼西亞語文本進行分類
問答系統
構建印度尼西亞語問答系統
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase