X

Xlm Roberta Base Multilingual Text Genre Classifier

由 classla 开发
X-GENRE分类器是一个基于xlm-roberta-base的多语言文本体裁分类模型,支持多种语言的自动体裁识别。
下载量 774
发布时间 : 11/11/2022

模型简介

该模型在多语言手动标注的X-GENRE体裁数据集上进行了微调,可用于自动识别文本体裁,适用于xlm-roberta-base支持的任何语言文本。

模型特点

多语言支持
支持多种语言的文本体裁分类,适用于xlm-roberta-base支持的任何语言文本。
高性能
在AGILE基准测试中表现优于其他技术,包括GPT模型。
广泛的体裁覆盖
支持9种不同的文本体裁分类,包括新闻、法律、促销等。

模型能力

多语言文本体裁分类
自动体裁识别
文本分类

使用案例

文本分析
大型文本集合的体裁标注
为大型文本集合自动添加体裁信息,便于后续分析和处理。
经过后处理后,性能达到宏F1和微F1值为0.92。
多语言文本体裁识别
识别多种语言文本的体裁,支持阿尔巴尼亚语、加泰罗尼亚语、克罗地亚语等多种语言。
在多语言测试数据集(X-GINCO)上宏F1值为0.847,微F1值为0.845。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase