N

Nusabert Base

由LazarusNLP開發
NusaBERT基礎版是基於BERT架構的多語言編碼器語言模型,支持13種印度尼西亞地區語言,在多個開源語料庫上進行了預訓練。
下載量 68
發布時間 : 2/21/2024

模型概述

NusaBERT是基於BERT架構的多語言編碼器語言模型,專門針對印度尼西亞及周邊地區的13種語言進行了優化,適用於各種自然語言處理任務。

模型特點

多語言支持
支持13種印度尼西亞及周邊地區的語言,包括主流語言和方言
大規模預訓練
在約160億詞元的多樣化語料庫上進行預訓練
優化性能
在保留測試集上取得0.6866的準確率和4.4266的困惑度

模型能力

文本理解
語言建模
多語言處理

使用案例

自然語言處理
文本分類
對印度尼西亞地區多種語言的文本進行分類
命名實體識別
識別印度尼西亞地區文本中的實體
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase