B

Bertovski

由 MaCoCu 开发
BERTovski是基于保加利亚语和马其顿语文本训练的大型预训练语言模型,采用RoBERTa架构,是MaCoCu项目的成果。
下载量 28
发布时间 : 8/11/2022

模型简介

BERTovski是一个专注于保加利亚语和马其顿语的自然语言处理模型,适用于多种语言任务,如词性标注、命名实体识别等。

模型特点

多语言支持
专注于保加利亚语和马其顿语,同时支持多语言处理任务。
高质量训练数据
训练数据经过严格筛选,仅包含原始.bg/.mk域的高质量文本,避免低质量机翻内容。
平衡数据分布
通过复制马其顿语数据平衡语料比例,确保两种语言在模型中的均衡表现。

模型能力

词性标注
命名实体识别
常识推理
文本理解

使用案例

自然语言处理
保加利亚语词性标注
在Universal Dependencies数据集上进行词性标注任务。
测试集准确率99.1%
马其顿语命名实体识别
在babushka-bench数据集上进行命名实体识别。
测试集准确率94.6%
语言理解
常识推理
在COPA测试集上进行常识推理任务。
保加利亚语51.7%,马其顿语51.8%
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase