X

XLMR MaCoCu Tr

由 MaCoCu 开发
XLMR-MaCoCu-tr 是基于土耳其语文本大规模预训练的语言模型,是MaCoCu项目的一部分,使用35GB土耳其语文本训练。
下载量 26
发布时间 : 8/11/2022

模型简介

该模型在XLM-RoBERTa-large模型基础上继续训练,专为土耳其语设计,适用于多种自然语言处理任务。

模型特点

大规模土耳其语训练
使用35GB土耳其语文本(44亿词符)进行训练,覆盖广泛的语言特征。
基于XLM-RoBERTa-large优化
在XLM-RoBERTa-large基础上继续训练,保持原有词表,优化土耳其语处理能力。
多任务性能优越
在POS标注、NER和COPA等任务上表现优异,超越同类土耳其语模型。

模型能力

词性标注(UPOS/XPOS)
命名实体识别(NER)
因果推理(COPA)
土耳其语文本理解

使用案例

自然语言处理
土耳其语文本标注
用于土耳其语文本的词性标注和命名实体识别。
在Universal Dependencies测试集上达到94.4%的NER准确率。
因果推理
用于土耳其语因果推理任务(COPA)。
在MT测试集上达到60.7%的准确率,优于BERTurk和XLM-R-large。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase