🚀 XLM-RoBERTa base通用依賴v2.8詞性標註:尼日利亞皮欽語
該模型是我們論文的一部分,論文名為:
- 《充分利用跨語言遷移:來自超100種語言詞性標註的證據》
查看Space瞭解更多詳情。
🚀 快速開始
此模型可用於詞性標註等任務,藉助transformers
庫可以方便地加載和使用。
✨ 主要特性
- 多語言支持:支持包括pcm等多種語言的詞性標註。
- 基於XLM-RoBERTa:利用了XLM-RoBERTa的強大跨語言表示能力。
📦 安裝指南
原文檔未提及安裝步驟,跳過該章節。
💻 使用示例
基礎用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-pcm")
model = AutoModelForTokenClassification.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-pcm")
高級用法
原文檔未提及高級用法代碼示例,跳過該部分。
📚 詳細文檔
模型信息
屬性 |
詳情 |
模型類型 |
用於詞性標註的XLM-RoBERTa base微調模型 |
訓練數據 |
Universal Dependencies v2.8 |
評估指標
語言 |
測試準確率 |
英語 |
77.2 |
荷蘭語 |
75.2 |
德語 |
73.2 |
意大利語 |
68.9 |
法語 |
74.0 |
西班牙語 |
75.1 |
俄語 |
70.3 |
瑞典語 |
78.9 |
挪威語 |
74.3 |
丹麥語 |
73.4 |
低地撒克遜語 |
37.9 |
阿卡德語 |
28.0 |
亞美尼亞語 |
65.4 |
威爾士語 |
59.7 |
古東斯拉夫語 |
61.0 |
阿爾巴尼亞語 |
66.1 |
斯洛文尼亞語 |
67.6 |
瓜賈加拉語 |
16.1 |
庫爾德語(庫爾曼吉方言) |
54.8 |
土耳其語 |
58.2 |
芬蘭語 |
67.4 |
印尼語 |
68.5 |
烏克蘭語 |
68.1 |
波蘭語 |
68.8 |
葡萄牙語 |
72.9 |
哈薩克語 |
60.1 |
拉丁語 |
64.3 |
古法語 |
51.1 |
布里亞特語 |
38.9 |
卡波語 |
16.7 |
韓語 |
52.4 |
愛沙尼亞語 |
68.3 |
克羅地亞語 |
73.0 |
哥特語 |
21.4 |
瑞士德語 |
33.4 |
亞述語 |
0.0 |
北薩米語 |
24.3 |
尼日利亞皮欽語 |
97.9 |
拉脫維亞語 |
66.3 |
中文 |
34.3 |
他加祿語 |
49.9 |
班巴拉語 |
16.7 |
立陶宛語 |
65.7 |
加利西亞語 |
72.4 |
越南語 |
54.3 |
希臘語 |
73.3 |
加泰羅尼亞語 |
73.6 |
捷克語 |
69.5 |
埃爾齊亞語 |
22.1 |
博傑普爾語 |
36.6 |
泰語 |
65.4 |
馬拉地語 |
50.3 |
巴斯克語 |
58.5 |
斯洛伐克語 |
70.4 |
基切語 |
8.0 |
約魯巴語 |
6.1 |
瓦爾皮里語 |
15.4 |
泰米爾語 |
60.1 |
馬耳他語 |
12.2 |
古希臘語 |
45.8 |
冰島語 |
72.5 |
姆比亞瓜拉尼語 |
11.4 |
烏爾都語 |
59.1 |
羅馬尼亞語 |
64.8 |
波斯語 |
67.2 |
阿普里納語 |
15.5 |
日語 |
26.1 |
匈牙利語 |
68.6 |
印地語 |
65.0 |
古漢語 |
30.4 |
科米-彼爾米亞克語 |
21.2 |
法羅語 |
61.6 |
梵語 |
25.6 |
利沃尼亞語 |
39.7 |
阿拉伯語 |
63.5 |
沃洛夫語 |
15.9 |
保加利亞語 |
74.6 |
阿昆楚語 |
26.5 |
馬庫拉普語 |
11.6 |
坎格里語 |
27.8 |
布列塔尼語 |
46.6 |
泰盧固語 |
59.4 |
粵語 |
30.7 |
古教會斯拉夫語 |
36.7 |
卡累利阿語 |
45.9 |
上索布語 |
49.3 |
南黎凡特阿拉伯語 |
42.5 |
科米-茲梁語 |
18.4 |
愛爾蘭語 |
48.3 |
納伊尼語 |
24.4 |
蒙杜魯庫語 |
16.1 |
馬恩島語 |
14.7 |
斯科爾特薩米語 |
5.4 |
南非荷蘭語 |
76.5 |
古土耳其語 |
0.0 |
圖皮南巴語 |
16.3 |
白俄羅斯語 |
70.7 |
塞爾維亞語 |
74.8 |
莫克沙語 |
24.1 |
西亞美尼亞語 |
59.8 |
蘇格蘭蓋爾語 |
45.4 |
昆薩里語 |
21.6 |
希伯來語 |
65.6 |
維吾爾語 |
55.0 |
楚科奇語 |
12.6 |
🔧 技術細節
原文檔未提及技術實現細節,跳過該章節。
📄 許可證
本項目採用Apache-2.0許可證。