🚀 XLM-RoBERTa基礎通用依存關係v2.8詞性標註:威爾士語
該模型用於解決跨語言詞性標註問題,能夠在超100種語言上進行詞性標註,具有良好的跨語言遷移能力。可通過特定的調用方式輕鬆使用該模型進行相關任務。
🚀 快速開始
該模型是論文《Make the Best of Cross-lingual Transfer: Evidence from POS Tagging with over 100 Languages》的一部分。更多詳細信息請查看 Space。
💻 使用示例
基礎用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-cy")
model = AutoModelForTokenClassification.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-cy")
📄 許可證
該模型使用的許可證為Apache-2.0。
📚 詳細文檔
模型信息
屬性 |
詳情 |
模型類型 |
用於詞性標註和標記分類的XLM-RoBERTa基礎模型 |
訓練數據 |
通用依存關係(Universal Dependencies)v2.8數據集 |
評估指標
該模型在多種語言上的詞性標註準確率如下:
語言 |
準確率 |
英語 |
78.9 |
荷蘭語 |
81.3 |
德語 |
78.3 |
意大利語 |
74.9 |
法語 |
77.1 |
西班牙語 |
81.0 |
俄語 |
82.0 |
瑞典語 |
80.6 |
挪威語 |
76.4 |
丹麥語 |
78.7 |
低地撒克遜語 |
52.7 |
阿卡德語 |
42.4 |
亞美尼亞語 |
73.7 |
威爾士語 |
94.9 |
古東斯拉夫語 |
71.6 |
阿爾巴尼亞語 |
76.8 |
斯洛文尼亞語 |
67.6 |
瓜賈拉語 |
33.1 |
庫爾德語(庫爾曼吉方言) |
77.1 |
土耳其語 |
72.0 |
芬蘭語 |
77.1 |
印尼語 |
75.0 |
烏克蘭語 |
80.9 |
波蘭語 |
82.7 |
葡萄牙語 |
80.1 |
哈薩克語 |
75.5 |
拉丁語 |
73.7 |
古法語 |
54.0 |
布里亞特語 |
60.2 |
卡波語 |
21.2 |
韓語 |
56.8 |
愛沙尼亞語 |
79.4 |
克羅地亞語 |
79.6 |
哥特語 |
29.3 |
瑞士德語 |
48.3 |
亞述語 |
14.6 |
北薩米語 |
45.4 |
尼日利亞皮欽語 |
35.7 |
拉脫維亞語 |
78.4 |
中文 |
39.9 |
他加祿語 |
71.9 |
班巴拉語 |
33.2 |
立陶宛語 |
77.7 |
加利西亞語 |
79.0 |
越南語 |
55.2 |
希臘語 |
79.5 |
加泰羅尼亞語 |
78.1 |
捷克語 |
80.7 |
埃爾齊亞語 |
48.3 |
博傑普爾語 |
55.0 |
泰語 |
53.2 |
馬拉地語 |
78.5 |
巴斯克語 |
69.5 |
斯洛伐克語 |
82.6 |
基切語 |
41.2 |
約魯巴語 |
33.9 |
瓦爾皮里語 |
36.8 |
泰米爾語 |
75.5 |
馬耳他語 |
36.4 |
古希臘語 |
55.4 |
冰島語 |
73.8 |
姆比亞瓜拉尼語 |
33.4 |
烏爾都語 |
64.6 |
羅馬尼亞語 |
76.5 |
波斯語 |
78.7 |
阿普里納語 |
48.4 |
日語 |
28.6 |
匈牙利語 |
79.9 |
印地語 |
70.9 |
古典中文 |
20.5 |
科米-彼爾米亞克語 |
53.0 |
法羅語 |
73.1 |
梵語 |
38.0 |
利沃尼亞語 |
65.3 |
阿拉伯語 |
85.9 |
沃洛夫語 |
43.4 |
保加利亞語 |
82.8 |
阿孔蘇語 |
36.0 |
馬庫拉普語 |
24.7 |
坎格里語 |
47.2 |
布列塔尼語 |
61.8 |
泰盧固語 |
74.6 |
粵語 |
40.7 |
古教會斯拉夫語 |
50.3 |
卡累利阿語 |
70.6 |
上索布語 |
74.1 |
南黎凡特阿拉伯語 |
70.1 |
科米-茲梁語 |
44.7 |
愛爾蘭語 |
69.5 |
納伊尼語 |
53.8 |
蒙杜魯庫語 |
28.1 |
馬恩島語 |
47.4 |
斯科爾特薩米語 |
42.0 |
南非荷蘭語 |
74.7 |
古土耳其語 |
38.0 |
圖皮南巴語 |
37.4 |
白俄羅斯語 |
84.5 |
塞爾維亞語 |
80.8 |
莫克沙語 |
47.7 |
西亞美尼亞語 |
68.7 |
蘇格蘭蓋爾語 |
67.4 |
昆薩里語 |
50.0 |
希伯來語 |
86.5 |
維吾爾語 |
68.9 |
楚科奇語 |
36.8 |