X

Xlm Roberta Base Multilingual Text Genre Classifier

由classla開發
X-GENRE分類器是一個基於xlm-roberta-base的多語言文本體裁分類模型,支持多種語言的自動體裁識別。
下載量 774
發布時間 : 11/11/2022

模型概述

該模型在多語言手動標註的X-GENRE體裁數據集上進行了微調,可用於自動識別文本體裁,適用於xlm-roberta-base支持的任何語言文本。

模型特點

多語言支持
支持多種語言的文本體裁分類,適用於xlm-roberta-base支持的任何語言文本。
高性能
在AGILE基準測試中表現優於其他技術,包括GPT模型。
廣泛的體裁覆蓋
支持9種不同的文本體裁分類,包括新聞、法律、促銷等。

模型能力

多語言文本體裁分類
自動體裁識別
文本分類

使用案例

文本分析
大型文本集合的體裁標註
為大型文本集合自動添加體裁信息,便於後續分析和處理。
經過後處理後,性能達到宏F1和微F1值為0.92。
多語言文本體裁識別
識別多種語言文本的體裁,支持阿爾巴尼亞語、加泰羅尼亞語、克羅地亞語等多種語言。
在多語言測試數據集(X-GINCO)上宏F1值為0.847,微F1值為0.845。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase