🚀 XLM-RoBERTa base Universal Dependencies v2.8 品詞タグ付け: スロバキア語
このモデルは、以下の論文の一部です。
- Make the Best of Cross-lingual Transfer: Evidence from POS Tagging with over 100 Languages
詳細については、Space を確認してください。
🚀 クイックスタート
このモデルは、スロバキア語の品詞タグ付けに使用できます。詳細については、上記の論文やリンク先を参照してください。
✨ 主な機能
- スロバキア語の品詞タグ付けが可能です。
- 多言語間の転移学習を活用しています。
📦 インストール
このモデルを使用するには、transformers
ライブラリが必要です。以下のコマンドでインストールできます。
pip install transformers
💻 使用例
基本的な使用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-sk")
model = AutoModelForTokenClassification.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-sk")
📚 ドキュメント
モデル情報
属性 |
詳情 |
モデルタイプ |
XLM-RoBERTa base |
学習データ |
Universal Dependencies v2.8 |
評価指標
このモデルは、様々な言語での品詞タグ付けの精度を測定しています。以下は、いくつかの言語での精度結果です。
言語 |
精度 |
英語 |
82.6 |
オランダ語 |
84.2 |
ドイツ語 |
79.4 |
イタリア語 |
82.0 |
フランス語 |
83.9 |
スペイン語 |
87.9 |
ロシア語 |
90.5 |
スウェーデン語 |
84.6 |
ノルウェー語 |
77.9 |
デンマーク語 |
82.2 |
低サクソン語 |
53.9 |
アッカド語 |
35.8 |
アルメニア語 |
83.8 |
ウェールズ語 |
64.8 |
古東スラブ語 |
74.9 |
アルバニア語 |
77.9 |
スロベニア語 |
87.7 |
グアヤジャラ語 |
36.6 |
クルディ語(クルマンジ方言) |
76.5 |
トルコ語 |
75.1 |
フィンランド語 |
79.5 |
インドネシア語 |
81.3 |
ウクライナ語 |
92.0 |
ポーランド語 |
93.3 |
ポルトガル語 |
85.1 |
カザフ語 |
79.5 |
ラテン語 |
77.1 |
古フランス語 |
58.0 |
ブリヤート語 |
60.6 |
カーポル語 |
22.1 |
韓国語 |
57.4 |
エストニア語 |
80.7 |
クロアチア語 |
93.7 |
ゴート語 |
28.3 |
スイスドイツ語 |
44.1 |
アッシリア語 |
14.8 |
北サーミ語 |
40.6 |
ナイジャ語 |
39.9 |
ラトビア語 |
84.2 |
中国語 |
42.5 |
タガログ語 |
70.8 |
バンバラ語 |
28.8 |
リトアニア語 |
85.8 |
ガリシア語 |
86.1 |
ベトナム語 |
67.4 |
ギリシャ語 |
84.6 |
カタルーニャ語 |
85.8 |
チェコ語 |
94.3 |
エルジャ語 |
49.8 |
ボジュプリ語 |
48.1 |
タイ語 |
58.1 |
マラーティー語 |
87.7 |
バスク語 |
74.0 |
スロバキア語 |
97.5 |
キチェ語 |
33.9 |
ヨルバ語 |
26.9 |
ワールピリ語 |
42.1 |
タミル語 |
83.0 |
マルタ語 |
29.1 |
古代ギリシャ語 |
59.0 |
アイスランド語 |
77.4 |
ムビャ・グアラニ語 |
33.1 |
ウルドゥー語 |
62.2 |
ルーマニア語 |
81.4 |
ペルシャ語 |
77.9 |
アプリナ語 |
46.7 |
日本語 |
27.4 |
ハンガリー語 |
81.9 |
ヒンディー語 |
65.3 |
古典中国語 |
30.2 |
コミ・ペルミャク語 |
48.7 |
フェロー語 |
75.4 |
サンスクリット語 |
36.3 |
リヴヴィ語 |
64.9 |
アラビア語 |
79.6 |
ウォロフ語 |
39.0 |
ブルガリア語 |
90.5 |
アクンツ語 |
39.1 |
マクララ語 |
24.7 |
カングリ語 |
49.9 |
ブルトン語 |
61.8 |
テルグ語 |
79.6 |
広東語 |
45.6 |
古教会スラブ語 |
45.9 |
カレリア語 |
67.9 |
上ソルビア語 |
78.6 |
南レバントアラビア語 |
66.7 |
コミ・ジュリアン語 |
44.2 |
アイルランド語 |
67.2 |
ナイニ語 |
43.6 |
ムンドゥルク語 |
27.3 |
マンクス語 |
36.8 |
スコルト・サーミ語 |
41.3 |
アフリカーンス語 |
79.2 |
古トルコ語 |
38.0 |
トゥピンアンバ語 |
40.3 |
ベラルーシ語 |
89.8 |
セルビア語 |
94.6 |
モクシャ語 |
48.2 |
西アルメニア語 |
76.0 |
スコットランド・ゲール語 |
57.0 |
クンサリ語 |
37.8 |
ヘブライ語 |
81.2 |
ウイグル語 |
72.4 |
チュクチ語 |
37.0 |
📄 ライセンス
このモデルは、Apache-2.0ライセンスの下で提供されています。