I

Indobert Base Uncased

由indolem開發
IndoBERT是專門針對印尼語優化的BERT模型,在多個印尼語NLP任務上表現優異。
下載量 26.35k
發布時間 : 3/2/2022

模型概述

印尼語版本的BERT模型,用於評估IndoLEM基準測試集,涵蓋形態句法、語義和篇章七個任務。

模型特點

印尼語優化
專門針對印尼語訓練,使用超過2.2億詞的印尼語語料庫。
多任務表現優異
在詞性標註、命名實體識別、情感分析等七個印尼語NLP任務上超越其他模型。
與英語BERT相當
開發集上的困惑度為3.97,與英語BERT基礎版相當。

模型能力

詞性標註
命名實體識別
依存句法分析
情感分析
摘要生成
推文預測
推文排序

使用案例

自然語言處理
印尼語詞性標註
為印尼語文本中的詞語標註詞性
準確率96.8%,優於Bi-LSTM和mBERT
印尼語命名實體識別
識別印尼語文本中的命名實體
UI數據集F1值90.1%,UGM數據集F1值74.9%
印尼語情感分析
分析印尼語文本的情感傾向
F1值84.13%,優於其他對比模型
社交媒體分析
下一條推文預測
預測印尼語用戶可能發送的下一條推文
準確率93.7%
推文排序
對印尼語推文進行相關性排序
斯皮爾曼相關係數0.59
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase