I

Indobert Base P2

由 indobenchmark 开发
IndoBERT是基于BERT模型的印尼语最先进的语言模型,通过掩码语言建模和下一句预测目标进行训练。
下载量 25.89k
发布时间 : 3/2/2022

模型简介

IndoBERT是一个针对印尼语优化的预训练语言模型,适用于各种自然语言理解任务。

模型特点

印尼语优化
专门针对印尼语进行预训练和优化
大规模训练数据
使用23.43GB的印尼语文本(Indo4B)进行训练
不区分大小写
第二阶段模型不区分大小写,提高文本处理灵活性

模型能力

文本表示学习
上下文理解
语言建模
句子关系预测

使用案例

自然语言处理
文本分类
可用于印尼语文本分类任务
命名实体识别
识别印尼语文本中的命名实体
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase