🚀 XLM-RoBERTa base通用依存v2.8品詞タグ付け:ナイジェリアピジン語
このモデルは、以下の論文の一部です。
- 《充分利用跨语言迁移:来自超100种语言词性标注的证据》
詳細については、Spaceを参照してください。
🚀 クイックスタート
このモデルは、品詞タグ付けなどのタスクに使用でき、transformers
ライブラリを使用することで簡単にロードして利用できます。
✨ 主な機能
- 多言語対応:pcmなどの複数の言語の品詞タグ付けをサポートしています。
- XLM-RoBERTaベース:XLM-RoBERTaの強力なクロス言語表現能力を活用しています。
💻 使用例
基本的な使用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-pcm")
model = AutoModelForTokenClassification.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-pcm")
📚 ドキュメント
モデル情報
属性 |
詳細 |
モデルタイプ |
品詞タグ付け用のXLM-RoBERTa base微調整モデル |
訓練データ |
Universal Dependencies v2.8 |
評価指標
言語 |
テスト正解率 |
英語 |
77.2 |
オランダ語 |
75.2 |
ドイツ語 |
73.2 |
イタリア語 |
68.9 |
フランス語 |
74.0 |
スペイン語 |
75.1 |
ロシア語 |
70.3 |
スウェーデン語 |
78.9 |
ノルウェー語 |
74.3 |
デンマーク語 |
73.4 |
低地サクソン語 |
37.9 |
アッカド語 |
28.0 |
アルメニア語 |
65.4 |
ウェールズ語 |
59.7 |
古東スラブ語 |
61.0 |
アルバニア語 |
66.1 |
スロベニア語 |
67.6 |
グアジャラ語 |
16.1 |
クルド語(クルマンジ方言) |
54.8 |
トルコ語 |
58.2 |
フィンランド語 |
67.4 |
インドネシア語 |
68.5 |
ウクライナ語 |
68.1 |
ポーランド語 |
68.8 |
ポルトガル語 |
72.9 |
カザフ語 |
60.1 |
ラテン語 |
64.3 |
古フランス語 |
51.1 |
ブリヤート語 |
38.9 |
カポ語 |
16.7 |
韓国語 |
52.4 |
エストニア語 |
68.3 |
クロアチア語 |
73.0 |
ゴート語 |
21.4 |
スイスドイツ語 |
33.4 |
アッシリア語 |
0.0 |
北サーミ語 |
24.3 |
ナイジェリアピジン語 |
97.9 |
ラトビア語 |
66.3 |
中国語 |
34.3 |
タガログ語 |
49.9 |
バンバラ語 |
16.7 |
リトアニア語 |
65.7 |
ガリシア語 |
72.4 |
ベトナム語 |
54.3 |
ギリシャ語 |
73.3 |
カタルーニャ語 |
73.6 |
チェコ語 |
69.5 |
エルツィャ語 |
22.1 |
ボジュプール語 |
36.6 |
タイ語 |
65.4 |
マラーティー語 |
50.3 |
バスク語 |
58.5 |
スロバキア語 |
70.4 |
キチェ語 |
8.0 |
ヨルバ語 |
6.1 |
ワルピリ語 |
15.4 |
タミル語 |
60.1 |
マルタ語 |
12.2 |
古代ギリシャ語 |
45.8 |
アイスランド語 |
72.5 |
ムビアグアラニ語 |
11.4 |
ウルドゥー語 |
59.1 |
ルーマニア語 |
64.8 |
ペルシャ語 |
67.2 |
アプリナ語 |
15.5 |
日本語 |
26.1 |
ハンガリー語 |
68.6 |
ヒンディー語 |
65.0 |
古代中国語 |
30.4 |
コミ・ペルミャク語 |
21.2 |
フェロー語 |
61.6 |
サンスクリット語 |
25.6 |
リヴォニア語 |
39.7 |
アラビア語 |
63.5 |
ウォロフ語 |
15.9 |
ブルガリア語 |
74.6 |
アクンチュ語 |
26.5 |
マクラプ語 |
11.6 |
カングリ語 |
27.8 |
ブルトン語 |
46.6 |
テルグ語 |
59.4 |
広東語 |
30.7 |
古教会スラブ語 |
36.7 |
カレリア語 |
45.9 |
上ソルブ語 |
49.3 |
南レバントアラビア語 |
42.5 |
コミ・ズリャン語 |
18.4 |
アイルランド語 |
48.3 |
ナイニー語 |
24.4 |
モンドゥルク語 |
16.1 |
マン島語 |
14.7 |
スコルトサーミ語 |
5.4 |
アフリカーンス語 |
76.5 |
古代トルコ語 |
0.0 |
トゥピンバ語 |
16.3 |
ベラルーシ語 |
70.7 |
セルビア語 |
74.8 |
モクシャ語 |
24.1 |
西アルメニア語 |
59.8 |
スコットランド・ゲール語 |
45.4 |
クンサリ語 |
21.6 |
ヘブライ語 |
65.6 |
ウイグル語 |
55.0 |
チュクチ語 |
12.6 |
📄 ライセンス
このプロジェクトは、Apache-2.0ライセンスを採用しています。