X

Xlm Roberta Base Multilingual Text Genre Classifier

classlaによって開発
X-GENRE分類器は、xlm-roberta-baseに基づく多言語テキストジャンル分類モデルで、複数の言語の自動ジャンル識別をサポートします。
ダウンロード数 774
リリース時間 : 11/11/2022

モデル概要

このモデルは、多言語で手動でアノテーションされたX-GENREジャンルデータセットで微調整されており、テキストジャンルの自動識別に使用でき、xlm-roberta-baseがサポートする任意の言語のテキストに適用できます。

モデル特徴

多言語サポート
複数の言語のテキストジャンル分類をサポートし、xlm-roberta-baseがサポートする任意の言語のテキストに適用できます。
高性能
AGILEベンチマークテストで、GPTモデルを含む他の技術よりも優れた性能を発揮します。
広範なジャンルカバレッジ
ニュース、法律、プロモーションなど、9種類の異なるテキストジャンル分類をサポートします。

モデル能力

多言語テキストジャンル分類
自動ジャンル識別
テキスト分類

使用事例

テキスト分析
大規模テキストコレクションのジャンルアノテーション
大規模なテキストコレクションに自動的にジャンル情報を追加し、後続の分析と処理を容易にします。
後処理後、マクロF1値とマイクロF1値が0.92に達します。
多言語テキストジャンル識別
アルバニア語、カタルーニャ語、クロアチア語など、複数の言語のテキストのジャンルを識別します。
多言語テストデータセット(X-GINCO)でマクロF1値が0.847、マイクロF1値が0.845です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase