🚀 XLM-RoBERTa base通用依赖v2.8词性标注:尼日利亚皮钦语
该模型是我们论文的一部分,论文名为:
- 《充分利用跨语言迁移:来自超100种语言词性标注的证据》
查看Space了解更多详情。
🚀 快速开始
此模型可用于词性标注等任务,借助transformers
库可以方便地加载和使用。
✨ 主要特性
- 多语言支持:支持包括pcm等多种语言的词性标注。
- 基于XLM-RoBERTa:利用了XLM-RoBERTa的强大跨语言表示能力。
📦 安装指南
原文档未提及安装步骤,跳过该章节。
💻 使用示例
基础用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-pcm")
model = AutoModelForTokenClassification.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-pcm")
高级用法
原文档未提及高级用法代码示例,跳过该部分。
📚 详细文档
模型信息
属性 |
详情 |
模型类型 |
用于词性标注的XLM-RoBERTa base微调模型 |
训练数据 |
Universal Dependencies v2.8 |
评估指标
语言 |
测试准确率 |
英语 |
77.2 |
荷兰语 |
75.2 |
德语 |
73.2 |
意大利语 |
68.9 |
法语 |
74.0 |
西班牙语 |
75.1 |
俄语 |
70.3 |
瑞典语 |
78.9 |
挪威语 |
74.3 |
丹麦语 |
73.4 |
低地撒克逊语 |
37.9 |
阿卡德语 |
28.0 |
亚美尼亚语 |
65.4 |
威尔士语 |
59.7 |
古东斯拉夫语 |
61.0 |
阿尔巴尼亚语 |
66.1 |
斯洛文尼亚语 |
67.6 |
瓜贾加拉语 |
16.1 |
库尔德语(库尔曼吉方言) |
54.8 |
土耳其语 |
58.2 |
芬兰语 |
67.4 |
印尼语 |
68.5 |
乌克兰语 |
68.1 |
波兰语 |
68.8 |
葡萄牙语 |
72.9 |
哈萨克语 |
60.1 |
拉丁语 |
64.3 |
古法语 |
51.1 |
布里亚特语 |
38.9 |
卡波语 |
16.7 |
韩语 |
52.4 |
爱沙尼亚语 |
68.3 |
克罗地亚语 |
73.0 |
哥特语 |
21.4 |
瑞士德语 |
33.4 |
亚述语 |
0.0 |
北萨米语 |
24.3 |
尼日利亚皮钦语 |
97.9 |
拉脱维亚语 |
66.3 |
中文 |
34.3 |
他加禄语 |
49.9 |
班巴拉语 |
16.7 |
立陶宛语 |
65.7 |
加利西亚语 |
72.4 |
越南语 |
54.3 |
希腊语 |
73.3 |
加泰罗尼亚语 |
73.6 |
捷克语 |
69.5 |
埃尔齐亚语 |
22.1 |
博杰普尔语 |
36.6 |
泰语 |
65.4 |
马拉地语 |
50.3 |
巴斯克语 |
58.5 |
斯洛伐克语 |
70.4 |
基切语 |
8.0 |
约鲁巴语 |
6.1 |
瓦尔皮里语 |
15.4 |
泰米尔语 |
60.1 |
马耳他语 |
12.2 |
古希腊语 |
45.8 |
冰岛语 |
72.5 |
姆比亚瓜拉尼语 |
11.4 |
乌尔都语 |
59.1 |
罗马尼亚语 |
64.8 |
波斯语 |
67.2 |
阿普里纳语 |
15.5 |
日语 |
26.1 |
匈牙利语 |
68.6 |
印地语 |
65.0 |
古汉语 |
30.4 |
科米-彼尔米亚克语 |
21.2 |
法罗语 |
61.6 |
梵语 |
25.6 |
利沃尼亚语 |
39.7 |
阿拉伯语 |
63.5 |
沃洛夫语 |
15.9 |
保加利亚语 |
74.6 |
阿昆楚语 |
26.5 |
马库拉普语 |
11.6 |
坎格里语 |
27.8 |
布列塔尼语 |
46.6 |
泰卢固语 |
59.4 |
粤语 |
30.7 |
古教会斯拉夫语 |
36.7 |
卡累利阿语 |
45.9 |
上索布语 |
49.3 |
南黎凡特阿拉伯语 |
42.5 |
科米-兹梁语 |
18.4 |
爱尔兰语 |
48.3 |
纳伊尼语 |
24.4 |
蒙杜鲁库语 |
16.1 |
马恩岛语 |
14.7 |
斯科尔特萨米语 |
5.4 |
南非荷兰语 |
76.5 |
古土耳其语 |
0.0 |
图皮南巴语 |
16.3 |
白俄罗斯语 |
70.7 |
塞尔维亚语 |
74.8 |
莫克沙语 |
24.1 |
西亚美尼亚语 |
59.8 |
苏格兰盖尔语 |
45.4 |
昆萨里语 |
21.6 |
希伯来语 |
65.6 |
维吾尔语 |
55.0 |
楚科奇语 |
12.6 |
🔧 技术细节
原文档未提及技术实现细节,跳过该章节。
📄 许可证
本项目采用Apache-2.0许可证。