🚀 北歐羅伯塔維基模型
本項目的北歐羅伯塔模型在瑞典語、丹麥語和挪威語的維基百科數據上進行訓練,可用於多種自然語言處理任務,為北歐語言的相關研究和應用提供了有力支持。
🚀 快速開始
該模型可直接通過Hugging Face的相關接口進行調用,你可以根據自身需求對其進行微調以適應特定任務。
✨ 主要特性
- 多語言支持:在瑞典語、丹麥語和挪威語的維基百科數據上進行訓練,能夠處理多種北歐語言。
- 廣泛應用:可用於命名實體識別、情感分析等自然語言處理任務。
📚 詳細文檔
模型描述
北歐羅伯塔模型在瑞典語、丹麥語和挪威語的維基百科數據上進行訓練,具備處理多種北歐語言的能力。
評估結果
丹麥語命名實體識別評估
在丹麥語命名實體識別任務上,對每個模型在DaNE數據集上進行3個輪次的微調,每個模型重複5次,並計算均值的95%置信區間。結果如下:
- xlm - roberta - base : 88.01 ± 0.43
- flax - community/nordic - roberta - wiki: 85.75 ± 0.69(本模型)
- Maltehb/danish - bert - botxo: 85.38 ± 0.55
- flax - community/roberta - base - danish: 80.14 ± 1.47
- flax - community/roberta - base - scandinavian : 78.03 ± 3.02
- Maltehb/-l - ctra - danish - electra - small - cased: 57.87 ± 3.19
- NbAiLab/nb - bert - base : 30.24 ± 1.21
- 隨機初始化的RoBERTa模型: 19.79 ± 2.00
丹麥語情感分析評估
在測試集上的結果,每個模型訓練5次,“±”表示平均得分的95%置信區間:
- Maltehb/danish - bert - botxo: 65.19 ± 0.53
- NbAiLab/nb - bert - base : 63.80 ± 0.77
- xlm - roberta - base : 63.55 ± 1.59
- flax - community/nordic - roberta - wiki : 56.46 ± 1.77
- flax - community/roberta - base - danish : 54.73 ± 8.96
- flax - community/roberta - base - scandinavian : 44.28 ± 9.21
- Maltehb/-l - ctra - danish - electra - small - cased : 47.78 ± 12.65
- 隨機初始化的RoBERTa模型: 36.96 ± 1.02
- Maltehb/roberta - base - scandinavian : 33.65 ± 8.32
模型系列
本模型是在Huggingface Flax/Jax挑戰期間,使用Flax Jax在TPU上訓練的一系列模型的一部分。
相關模型鏈接
GPT模型
- 瑞典語GPT:https://huggingface.co/birgermoell/swedish - gpt/
- 瑞典語GPT維基:https://huggingface.co/flax - community/swe - gpt - wiki
- 北歐GPT維基:https://huggingface.co/flax - community/nordic - gpt - wiki
- 丹麥語GPT維基:https://huggingface.co/flax - community/dansk - gpt - wiki
- 挪威語GPT維基:https://huggingface.co/flax - community/norsk - gpt - wiki
Roberta模型
- 北歐Roberta維基:https://huggingface.co/flax - community/nordic - roberta - wiki
- 瑞典語Roberta維基Oscar:https://huggingface.co/flax - community/swe - roberta - wiki - oscar
- 瑞典語Scandi Roberta:https://huggingface.co/birgermoell/roberta - swedish - scandi
- 瑞典語Roberta:https://huggingface.co/birgermoell/roberta - swedish
瑞典語T5模型
- 瑞典語T5基礎模型:https://huggingface.co/birgermoell/t5 - base - swedish
📄 許可證
本項目採用CC - BY - 4.0許可證。