🚀 XLM-RoBERTa base Universal Dependencies v2.8 品詞タグ付け: ゴート語
このモデルは、以下の論文の一部です。
- Make the Best of Cross-lingual Transfer: Evidence from POS Tagging with over 100 Languages
詳細については、Space を確認してください。
🚀 クイックスタート
このセクションでは、モデルの概要と基本的な使い方を説明します。
モデル概要
属性 |
详情 |
モデルタイプ |
品詞タグ付け、トークン分類 |
訓練データ |
Universal Dependencies v2.8 |
評価指標
このモデルは、様々な言語に対する精度を測定するために、正解率 (accuracy) を指標として使用しています。以下に、各言語のテスト精度を示します。
言語 |
正解率 |
英語 |
47.9 |
オランダ語 |
50.2 |
ドイツ語 |
38.9 |
イタリア語 |
46.8 |
フランス語 |
50.2 |
スペイン語 |
51.3 |
ロシア語 |
52.4 |
スウェーデン語 |
51.5 |
ノルウェー語 |
49.1 |
デンマーク語 |
50.8 |
ロー・サクソン語 |
32.8 |
アッカド語 |
43.8 |
アルメニア語 |
50.4 |
ウェールズ語 |
41.1 |
古東スラブ語 |
53.9 |
アルバニア語 |
49.0 |
スロベニア語 |
45.3 |
グアジャラ語 |
23.8 |
クルド語 (クルマンジ方言) |
49.3 |
トルコ語 |
46.6 |
フィンランド語 |
51.2 |
インドネシア語 |
55.4 |
ウクライナ語 |
50.0 |
ポーランド語 |
52.4 |
ポルトガル語 |
50.4 |
カザフ語 |
46.5 |
ラテン語 |
49.1 |
古フランス語 |
47.6 |
ブリヤート語 |
37.4 |
カーポール語 |
33.8 |
韓国語 |
41.5 |
エストニア語 |
49.5 |
クロアチア語 |
57.2 |
ゴート語 |
93.6 |
スイス・ドイツ語 |
25.1 |
アッシリア語 |
4.0 |
北サーミ語 |
27.9 |
ナイジャ語 |
29.2 |
ラトビア語 |
51.5 |
中国語 |
16.4 |
タガログ語 |
42.0 |
バンバラ語 |
13.1 |
リトアニア語 |
50.5 |
ガリシア語 |
49.2 |
ベトナム語 |
47.1 |
ギリシャ語 |
42.0 |
カタルーニャ語 |
50.1 |
チェコ語 |
54.3 |
エルジャ語 |
22.1 |
ボジュプリ語 |
38.8 |
タイ語 |
34.7 |
マラーティー語 |
35.0 |
バスク語 |
45.9 |
スロバキア語 |
55.3 |
キチェ語 |
23.3 |
ヨルバ語 |
15.0 |
ワールピリ語 |
23.5 |
タミル語 |
41.1 |
マルタ語 |
21.4 |
古代ギリシャ語 |
50.9 |
アイスランド語 |
50.3 |
ムビャ・グアラニ語 |
14.8 |
ウルドゥー語 |
41.4 |
ルーマニア語 |
50.1 |
ペルシャ語 |
53.1 |
アプリナ語 |
20.8 |
日本語 |
16.3 |
ハンガリー語 |
42.3 |
ヒンディー語 |
45.2 |
古典中国語 |
19.6 |
コミ・ペルミャク語 |
23.4 |
フェロー語 |
48.9 |
サンスクリット語 |
32.4 |
リヴィ語 |
38.5 |
アラビア語 |
49.6 |
ウォロフ語 |
28.4 |
ブルガリア語 |
55.6 |
アクンツ語 |
25.2 |
マクララプ語 |
18.5 |
カングリ語 |
34.2 |
ブルトン語 |
36.7 |
テルグ語 |
38.8 |
広東語 |
17.1 |
古教会スラブ語 |
50.2 |
カレリア語 |
41.7 |
上ソルビア語 |
42.7 |
南レバント・アラビア語 |
38.9 |
コミ・ジリアン語 |
21.1 |
アイルランド語 |
37.2 |
ナイニ語 |
33.3 |
ムンドゥルク語 |
26.6 |
マンクス語 |
17.6 |
スコルト・サーミ語 |
19.9 |
アフリカーンス語 |
45.9 |
古トルコ語 |
2.7 |
トゥピンアンバ語 |
23.4 |
ベラルーシ語 |
53.0 |
セルビア語 |
57.4 |
モクシャ語 |
24.5 |
西アルメニア語 |
47.2 |
スコットランド・ゲール語 |
36.7 |
クンサリ語 |
28.4 |
ヘブライ語 |
44.8 |
ウイグル語 |
48.6 |
チュクチ語 |
21.0 |
💻 使用例
基本的な使用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-got")
model = AutoModelForTokenClassification.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-got")
📄 ライセンス
このモデルは、Apache-2.0ライセンスの下で提供されています。