🚀 英語到凱爾特語翻譯項目
本項目專注於英語到凱爾特語的翻譯,利用特定的模型和處理方式,為英語到多種凱爾特語的翻譯提供支持,具有一定的應用價值。
🚀 快速開始
本項目主要實現從英語到凱爾特語的翻譯,以下是相關信息:
✨ 主要特性
- 模型類型:Transformer
- 預處理方式:歸一化 + SentencePiece (spm32k, spm32k)
- 語言標記要求:句子開頭需要以
>>id<<
形式的語言標記(id 為有效的目標語言 ID)
📦 安裝指南
可通過下載原始權重來使用該模型:
opus2m - 2020 - 08 - 01.zip
📚 詳細文檔
測試集相關
基準測試
測試集 |
BLEU |
chr - F |
Tatoeba - test.eng - bre.eng.bre |
11.5 |
0.338 |
Tatoeba - test.eng - cor.eng.cor |
0.3 |
0.095 |
Tatoeba - test.eng - cym.eng.cym |
31.0 |
0.549 |
Tatoeba - test.eng - gla.eng.gla |
7.6 |
0.317 |
Tatoeba - test.eng - gle.eng.gle |
35.9 |
0.582 |
Tatoeba - test.eng - glv.eng.glv |
9.9 |
0.454 |
Tatoeba - test.eng.multi |
18.0 |
0.342 |
系統信息
屬性 |
詳情 |
模型名稱 |
eng - cel |
源語言 |
eng |
目標語言 |
cel |
OPUS 說明文檔鏈接 |
https://github.com/Helsinki-NLP/Tatoeba-Challenge/tree/master/models/eng-cel/README.md |
原始倉庫 |
Tatoeba - Challenge |
標籤 |
['translation'] |
支持語言 |
['en', 'gd', 'ga', 'br', 'kw', 'gv', 'cy', 'cel'] |
源語言組成 |
{'eng'} |
目標語言組成 |
{'gla', 'gle', 'bre', 'cor', 'glv', 'cym'} |
源語言是否多語言 |
否 |
目標語言是否多語言 |
是 |
預處理方式 |
歸一化 + SentencePiece (spm32k, spm32k) |
模型下載鏈接 |
https://object.pouta.csc.fi/Tatoeba-MT-models/eng-cel/opus2m-2020-08-01.zip |
測試集鏈接 |
https://object.pouta.csc.fi/Tatoeba-MT-models/eng-cel/opus2m-2020-08-01.test.txt |
源語言 ISO 639 - 3 代碼 |
eng |
目標語言 ISO 639 - 3 代碼 |
cel |
短語言對 |
en - cel |
chrF2 得分 |
0.342 |
BLEU 得分 |
18.0 |
簡潔懲罰係數 |
0.9590000000000001 |
參考長度 |
45370.0 |
源語言名稱 |
English |
目標語言名稱 |
Celtic languages |
訓練日期 |
2020 - 08 - 01 |
源語言 ISO 639 - 2 代碼 |
en |
目標語言 ISO 639 - 2 代碼 |
cel |
是否優先舊版本 |
否 |
長語言對 |
eng - cel |
Helsinki 倉庫 Git SHA |
480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535 |
Transformers 倉庫 Git SHA |
2207e5d8cb224e954a7cba69fa4ac2309e9ff30b |
移植機器 |
brutasse |
移植時間 |
2020 - 08 - 21 - 14:41 |
📄 許可證
本項目採用 Apache - 2.0 許可證。