🚀 XLM-RoBERTaベースのUniversal Dependencies v2.8品詞タグ付け: スコットランド・ゲール語
このモデルは、以下の論文の一部です。
- Make the Best of Cross-lingual Transfer: Evidence from POS Tagging with over 100 Languages
詳細については、Spaceを確認してください。
🚀 クイックスタート
このモデルを使用することで、スコットランド・ゲール語の品詞タグ付けを行うことができます。
✨ 主な機能
- 100以上の言語での品詞タグ付けに対応
- クロス言語転移を活用した高精度な品詞タグ付け
📦 インストール
このモデルを使用するには、transformers
ライブラリが必要です。以下のコマンドでインストールできます。
pip install transformers
💻 使用例
基本的な使用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-gd")
model = AutoModelForTokenClassification.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-gd")
📚 ドキュメント
モデル情報
属性 |
详情 |
モデルタイプ |
XLM-RoBERTaベース |
学習データ |
Universal Dependencies v2.8 |
評価指標
このモデルは、複数の言語での品詞タグ付けに対して評価されています。以下は、各言語での正解率です。
言語 |
正解率 |
英語 |
75.0 |
オランダ語 |
77.8 |
ドイツ語 |
76.5 |
イタリア語 |
70.8 |
フランス語 |
74.6 |
スペイン語 |
78.7 |
ロシア語 |
79.2 |
スウェーデン語 |
78.9 |
ノルウェー語 |
72.7 |
デンマーク語 |
78.0 |
ロー・ザクセン語 |
51.0 |
アッカド語 |
47.0 |
アルメニア語 |
69.2 |
ウェールズ語 |
77.0 |
古東スラブ語 |
70.1 |
アルバニア語 |
76.1 |
スロベニア語 |
64.3 |
グアヤジャラ語 |
42.6 |
クルディ語 |
73.6 |
トルコ語 |
71.7 |
フィンランド語 |
74.4 |
インドネシア語 |
74.2 |
ウクライナ語 |
78.7 |
ポーランド語 |
81.4 |
ポルトガル語 |
77.9 |
カザフ語 |
73.3 |
ラテン語 |
68.8 |
古フランス語 |
48.7 |
ブリヤート語 |
58.4 |
カーポール語 |
24.6 |
韓国語 |
58.9 |
エストニア語 |
76.8 |
クロアチア語 |
74.0 |
ゴート語 |
29.4 |
スイス・ドイツ語 |
48.3 |
アッシリア語 |
20.1 |
北サーミ語 |
44.3 |
ナイジャ語 |
40.4 |
ラトビア語 |
76.7 |
中国語 |
51.6 |
タガログ語 |
68.3 |
バンバラ語 |
30.3 |
リトアニア語 |
77.2 |
ガリシア語 |
77.6 |
ベトナム語 |
56.5 |
ギリシャ語 |
79.1 |
カタルーニャ語 |
74.5 |
チェコ語 |
78.7 |
エルザヤ語 |
51.6 |
ボジュプリ語 |
49.4 |
タイ語 |
57.1 |
マラーティー語 |
72.4 |
バスク語 |
65.9 |
スロバキア語 |
80.3 |
キチェ語 |
45.0 |
ヨルバ語 |
32.5 |
ワールピリ語 |
43.7 |
タミル語 |
76.7 |
マルタ語 |
34.9 |
古代ギリシャ語 |
59.3 |
アイスランド語 |
73.1 |
ムビャ・グアラニ語 |
34.5 |
ウルドゥー語 |
56.0 |
ルーマニア語 |
74.4 |
ペルシャ語 |
77.3 |
アプリナ語 |
48.4 |
日本語 |
38.6 |
ハンガリー語 |
78.5 |
ヒンディー語 |
60.5 |
古典中国語 |
31.6 |
コミ・ペルミャク語 |
50.4 |
フェロー語 |
71.2 |
サンスクリット語 |
33.5 |
リヴヴィ語 |
61.6 |
アラビア語 |
81.6 |
ウォロフ語 |
38.1 |
ブルガリア語 |
76.6 |
アクンツ語 |
39.8 |
マクラパ語 |
23.3 |
カングリ語 |
44.0 |
ブルトン語 |
60.9 |
テルグ語 |
74.5 |
広東語 |
48.9 |
古教会スラブ語 |
47.7 |
カレリア語 |
65.4 |
上ソルブ語 |
70.9 |
南レバントアラビア語 |
68.4 |
コミ・ジリャン語 |
45.0 |
アイルランド語 |
76.6 |
ナイニ語 |
44.9 |
ムンドゥルク語 |
34.0 |
マンクス語 |
52.0 |
スコルト・サーミ語 |
39.7 |
アフリカーンス語 |
74.0 |
古トルコ語 |
37.1 |
トゥピンアンバ語 |
48.1 |
ベラルーシ語 |
79.7 |
セルビア語 |
72.7 |
モクシャ語 |
49.3 |
西アルメニア語 |
68.1 |
スコットランド・ゲール語 |
93.3 |
クンサリ語 |
44.6 |
ヘブライ語 |
86.5 |
ウイグル語 |
67.5 |
チュクチ語 |
38.8 |
📄 ライセンス
このモデルは、Apache-2.0ライセンスの下で提供されています。