🚀 XLM-RoBERTa基礎模型在通用依存關係v2.8詞性標註中的應用:哥特語
本模型是我們論文 《充分利用跨語言遷移:來自超100種語言詞性標註的證據》 的一部分。
查看 Space 瞭解更多詳情。
🚀 快速開始
本模型可用於詞性標註和標記分類任務,基於通用依存關係v2.8數據集進行訓練。以下是使用該模型的基本步驟。
✨ 主要特性
- 多語言支持:支持多種語言的詞性標註任務,在哥特語上表現尤為出色。
- 模型類型:基於
transformers
庫的XLM-RoBERTa
基礎模型。
- 訓練數據:使用通用依存關係v2.8(Universal Dependencies v2.8)數據集。
屬性 |
詳情 |
模型類型 |
XLM-RoBERTa基礎模型 |
訓練數據 |
通用依存關係v2.8數據集 |
📦 安裝指南
暫未提供相關安裝步驟。
💻 使用示例
基礎用法
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-got")
model = AutoModelForTokenClassification.from_pretrained("wietsedv/xlm-roberta-base-ft-udpos28-got")
📚 詳細文檔
評估指標
模型在多種語言上的測試準確率如下:
語言 |
測試準確率 |
英語 |
47.9 |
荷蘭語 |
50.2 |
德語 |
38.9 |
意大利語 |
46.8 |
法語 |
50.2 |
西班牙語 |
51.3 |
俄語 |
52.4 |
瑞典語 |
51.5 |
挪威語 |
49.1 |
丹麥語 |
50.8 |
低地撒克遜語 |
32.8 |
阿卡德語 |
43.8 |
亞美尼亞語 |
50.4 |
威爾士語 |
41.1 |
古東斯拉夫語 |
53.9 |
阿爾巴尼亞語 |
49.0 |
斯洛文尼亞語 |
45.3 |
瓜拉尼語 |
23.8 |
庫爾德語(庫爾曼吉方言) |
49.3 |
土耳其語 |
46.6 |
芬蘭語 |
51.2 |
印尼語 |
55.4 |
烏克蘭語 |
50.0 |
波蘭語 |
52.4 |
葡萄牙語 |
50.4 |
哈薩克語 |
46.5 |
拉丁語 |
49.1 |
古法語 |
47.6 |
布里亞特語 |
37.4 |
卡波語 |
33.8 |
韓語 |
41.5 |
愛沙尼亞語 |
49.5 |
克羅地亞語 |
57.2 |
哥特語 |
93.6 |
瑞士德語 |
25.1 |
亞述語 |
4.0 |
北薩米語 |
27.9 |
尼日利亞皮欽語 |
29.2 |
拉脫維亞語 |
51.5 |
中文 |
16.4 |
他加祿語 |
42.0 |
班巴拉語 |
13.1 |
立陶宛語 |
50.5 |
加利西亞語 |
49.2 |
越南語 |
47.1 |
希臘語 |
42.0 |
加泰羅尼亞語 |
50.1 |
捷克語 |
54.3 |
埃爾齊亞語 |
22.1 |
博傑普爾語 |
38.8 |
泰語 |
34.7 |
馬拉地語 |
35.0 |
巴斯克語 |
45.9 |
斯洛伐克語 |
55.3 |
基切語 |
23.3 |
約魯巴語 |
15.0 |
瓦爾皮里語 |
23.5 |
泰米爾語 |
41.1 |
馬耳他語 |
21.4 |
古希臘語 |
50.9 |
冰島語 |
50.3 |
姆比亞瓜拉尼語 |
14.8 |
烏爾都語 |
41.4 |
羅馬尼亞語 |
50.1 |
波斯語 |
53.1 |
阿普里納語 |
20.8 |
日語 |
16.3 |
匈牙利語 |
42.3 |
印地語 |
45.2 |
古漢語 |
19.6 |
科米-彼爾姆語 |
23.4 |
法羅語 |
48.9 |
梵語 |
32.4 |
利沃尼亞語 |
38.5 |
阿拉伯語 |
49.6 |
沃洛夫語 |
28.4 |
保加利亞語 |
55.6 |
阿昆楚語 |
25.2 |
馬庫拉普語 |
18.5 |
坎格里語 |
34.2 |
布列塔尼語 |
36.7 |
泰盧固語 |
38.8 |
粵語 |
17.1 |
古教會斯拉夫語 |
50.2 |
卡累利阿語 |
41.7 |
上索布語 |
42.7 |
南黎凡特阿拉伯語 |
38.9 |
科米-茲梁語 |
21.1 |
愛爾蘭語 |
37.2 |
納伊尼語 |
33.3 |
蒙杜魯庫語 |
26.6 |
馬恩島語 |
17.6 |
斯科爾特薩米語 |
19.9 |
南非荷蘭語 |
45.9 |
古土耳其語 |
2.7 |
圖皮南巴語 |
23.4 |
白俄羅斯語 |
53.0 |
塞爾維亞語 |
57.4 |
莫克沙語 |
24.5 |
西亞美尼亞語 |
47.2 |
蘇格蘭蓋爾語 |
36.7 |
昆薩里語 |
28.4 |
希伯來語 |
44.8 |
維吾爾語 |
48.6 |
楚科奇語 |
21.0 |
📄 許可證
本模型使用Apache 2.0許可證。