🚀 英文 - 挪威語翻譯模型
本項目提供了一個英文到挪威語的翻譯模型,支持挪威語的兩種主要變體(書面挪威語 nb
和新挪威語 nn
)。該模型基於Transformer架構,使用了大量的訓練數據,能夠實現高質量的翻譯。
🚀 快速開始
你可以通過以下鏈接下載模型的原始權重:
opus+bt-2021-04-20.zip
在使用模型時,需要在句子開頭添加語言標記,格式為 >>id<<
(id
通常是有效的三字母目標語言ID)。
📦 模型信息
屬性 |
詳情 |
模型類型 |
transformer-align |
源語言代碼 |
en |
目標語言代碼 |
nb, nn |
數據集 |
opus 及反向翻譯數據 |
發佈日期 |
2021-04-20 |
預處理 |
歸一化 + SentencePiece (spm32k,spm32k) |
📚 詳細文檔
訓練數據
- 英文 - 新挪威語 (
eng-nno
):Tatoeba-train (1661769)、wikipedia.aa.nno-eng (995603)、wikipedia.ab.nno-eng (605107)、wikiquote.aa.nno-eng (22626)
- 英文 - 書面挪威語 (
eng-nob
):Tatoeba-train (11525999)、wikibooks.aa.nob-eng (37901)、wikinews.aa.nob-eng (8706)、wikipedia.aa.nob-eng (992563)、wikipedia.ab.nob-eng (992772)、wikipedia.ac.nob-eng (992621)、wikipedia.ad.nob-eng (992828)、wikipedia.ae.nob-eng (992812)、wikipedia.af.nob-eng (976715)、wikiquote.aa.nob-eng (10443)、wikisource.aa.nob-eng (279891)
驗證數據
- 英文 - 新挪威語 (
eng-nno
):Tatoeba-dev, 505
- 英文 - 書面挪威語 (
eng-nob
):Tatoeba-dev, 5189
- 總大小(打亂後):1505
- 驗證集選擇:Tatoeba-dev.src.shuffled 的前 1505 行
測試數據
- Tatoeba-test.eng-nno:460/3428
- Tatoeba-test.eng-nob:4539/36110
- Tatoeba-test.eng-nor:4999/39547
測試集文件
評估指標
BLEU 分數
測試集 |
分數 |
Tatoeba-test.eng-nob |
56.4 |
Tatoeba-test.eng-nor |
55.4 |
Tatoeba-test.eng-nno |
40.3 |
chr-F 分數
測試集 |
分數 |
Tatoeba-test.eng-nob |
0.716 |
Tatoeba-test.eng-nor |
0.71 |
Tatoeba-test.eng-nno |
0.615 |
🔧 系統信息
- Hugging Face 名稱:eng-nor
- 源語言:en
- 目標語言:nb, nn
- OPUS 文檔鏈接:https://object.pouta.csc.fi/Tatoeba-MT-models/eng-nor/opus+bt-2021-04-20.zip/README.md
- 原始倉庫:Tatoeba-Challenge
- 標籤:['translation']
- 支持語言:['en', 'nb', 'nn']
- 源語言成分:['eng']
- 目標語言成分:['nob', 'nno']
- 源語言多語言支持:False
- 目標語言多語言支持:True
- Helsinki 代碼提交哈希:59400fea592520766f9910390155681bc930dbc4
- Transformers 代碼提交哈希:fd5cdaeea6eafac32e9d967327bfa3dc0e0d962d
- 移植機器:DESKTOP-6CPR2HH
- 移植時間:2023-01-23-21:07
📄 許可證
本項目採用 Apache-2.0 許可證。