I

Indobert Large P2

由indobenchmark開發
IndoBERT是基於BERT模型針對印尼語開發的尖端語言模型,採用掩碼語言建模(MLM)和下一句預測(NSP)目標進行訓練。
下載量 2,272
發布時間 : 3/2/2022

模型概述

IndoBERT是針對印尼語優化的預訓練語言模型,主要用於自然語言理解任務,支持印尼語文本的上下文表徵提取和語言理解。

模型特點

印尼語優化
專門針對印尼語進行優化,適用於印尼語的自然語言處理任務。
大規模預訓練
基於Indo4B數據集(23.43 GB文本)進行預訓練,具有強大的語言理解能力。
無大小寫區分
模型在第二階段訓練中不區分大小寫,適用於不同大小寫的文本輸入。

模型能力

印尼語文本理解
上下文表徵提取
掩碼語言建模
下一句預測

使用案例

自然語言處理
文本分類
用於印尼語文本的分類任務,如情感分析、主題分類等。
命名實體識別
識別印尼語文本中的命名實體,如人名、地名、組織名等。
語言模型微調
下游任務微調
可用於微調以適配特定的印尼語NLP任務。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase