🚀 XLM-RoBERTa基础通用依存关系v2.8词性标注:威尔士语
该模型用于解决跨语言词性标注问题,能够在超100种语言上进行词性标注,具有良好的跨语言迁移能力。可通过特定的调用方式轻松使用该模型进行相关任务。
🚀 快速开始
该模型是论文《Make the Best of Cross-lingual Transfer: Evidence from POS Tagging with over 100 Languages》的一部分。更多详细信息请查看 Space。
💻 使用示例
基础用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-cy")
model = AutoModelForTokenClassification.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-cy")
📄 许可证
该模型使用的许可证为Apache-2.0。
📚 详细文档
模型信息
属性 |
详情 |
模型类型 |
用于词性标注和标记分类的XLM-RoBERTa基础模型 |
训练数据 |
通用依存关系(Universal Dependencies)v2.8数据集 |
评估指标
该模型在多种语言上的词性标注准确率如下:
语言 |
准确率 |
英语 |
78.9 |
荷兰语 |
81.3 |
德语 |
78.3 |
意大利语 |
74.9 |
法语 |
77.1 |
西班牙语 |
81.0 |
俄语 |
82.0 |
瑞典语 |
80.6 |
挪威语 |
76.4 |
丹麦语 |
78.7 |
低地撒克逊语 |
52.7 |
阿卡德语 |
42.4 |
亚美尼亚语 |
73.7 |
威尔士语 |
94.9 |
古东斯拉夫语 |
71.6 |
阿尔巴尼亚语 |
76.8 |
斯洛文尼亚语 |
67.6 |
瓜贾拉语 |
33.1 |
库尔德语(库尔曼吉方言) |
77.1 |
土耳其语 |
72.0 |
芬兰语 |
77.1 |
印尼语 |
75.0 |
乌克兰语 |
80.9 |
波兰语 |
82.7 |
葡萄牙语 |
80.1 |
哈萨克语 |
75.5 |
拉丁语 |
73.7 |
古法语 |
54.0 |
布里亚特语 |
60.2 |
卡波语 |
21.2 |
韩语 |
56.8 |
爱沙尼亚语 |
79.4 |
克罗地亚语 |
79.6 |
哥特语 |
29.3 |
瑞士德语 |
48.3 |
亚述语 |
14.6 |
北萨米语 |
45.4 |
尼日利亚皮钦语 |
35.7 |
拉脱维亚语 |
78.4 |
中文 |
39.9 |
他加禄语 |
71.9 |
班巴拉语 |
33.2 |
立陶宛语 |
77.7 |
加利西亚语 |
79.0 |
越南语 |
55.2 |
希腊语 |
79.5 |
加泰罗尼亚语 |
78.1 |
捷克语 |
80.7 |
埃尔齐亚语 |
48.3 |
博杰普尔语 |
55.0 |
泰语 |
53.2 |
马拉地语 |
78.5 |
巴斯克语 |
69.5 |
斯洛伐克语 |
82.6 |
基切语 |
41.2 |
约鲁巴语 |
33.9 |
瓦尔皮里语 |
36.8 |
泰米尔语 |
75.5 |
马耳他语 |
36.4 |
古希腊语 |
55.4 |
冰岛语 |
73.8 |
姆比亚瓜拉尼语 |
33.4 |
乌尔都语 |
64.6 |
罗马尼亚语 |
76.5 |
波斯语 |
78.7 |
阿普里纳语 |
48.4 |
日语 |
28.6 |
匈牙利语 |
79.9 |
印地语 |
70.9 |
古典中文 |
20.5 |
科米-彼尔米亚克语 |
53.0 |
法罗语 |
73.1 |
梵语 |
38.0 |
利沃尼亚语 |
65.3 |
阿拉伯语 |
85.9 |
沃洛夫语 |
43.4 |
保加利亚语 |
82.8 |
阿孔苏语 |
36.0 |
马库拉普语 |
24.7 |
坎格里语 |
47.2 |
布列塔尼语 |
61.8 |
泰卢固语 |
74.6 |
粤语 |
40.7 |
古教会斯拉夫语 |
50.3 |
卡累利阿语 |
70.6 |
上索布语 |
74.1 |
南黎凡特阿拉伯语 |
70.1 |
科米-兹梁语 |
44.7 |
爱尔兰语 |
69.5 |
纳伊尼语 |
53.8 |
蒙杜鲁库语 |
28.1 |
马恩岛语 |
47.4 |
斯科尔特萨米语 |
42.0 |
南非荷兰语 |
74.7 |
古土耳其语 |
38.0 |
图皮南巴语 |
37.4 |
白俄罗斯语 |
84.5 |
塞尔维亚语 |
80.8 |
莫克沙语 |
47.7 |
西亚美尼亚语 |
68.7 |
苏格兰盖尔语 |
67.4 |
昆萨里语 |
50.0 |
希伯来语 |
86.5 |
维吾尔语 |
68.9 |
楚科奇语 |
36.8 |