🚀 epo - afr翻譯項目
本項目專注於從世界語(Esperanto)到南非語(Afrikaans)的翻譯,採用了特定的模型和處理方式,為相關領域提供了有效的翻譯解決方案。
✨ 主要特性
- 語言對明確:明確針對世界語到南非語的翻譯任務。
- 模型選擇:採用
transformer - align
模型進行翻譯工作。
- 預處理方式:運用歸一化(normalization)和SentencePiece(spm4k, spm4k)進行預處理。
📦 資源獲取
- OPUS說明文檔:[epo - afr](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/epo - afr/README.md)
- 原始權重下載:[opus - 2020 - 06 - 16.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - afr/opus - 2020 - 06 - 16.zip)
- 測試集翻譯:[opus - 2020 - 06 - 16.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - afr/opus - 2020 - 06 - 16.test.txt)
- 測試集評分:[opus - 2020 - 06 - 16.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - afr/opus - 2020 - 06 - 16.eval.txt)
📚 詳細文檔
基準測試
測試集 |
BLEU |
chr - F |
Tatoeba - test.epo.afr |
19.5 |
0.369 |
系統信息
屬性 |
詳情 |
hf名稱 |
epo - afr |
源語言 |
epo(世界語) |
目標語言 |
afr(南非語) |
OPUS說明文檔鏈接 |
[epo - afr](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/epo - afr/README.md) |
原始倉庫 |
Tatoeba - Challenge |
標籤 |
['translation'] |
語言 |
['eo', 'af'] |
源語言成分 |
{'epo'} |
目標語言成分 |
{'afr'} |
源語言多語言性 |
否 |
目標語言多語言性 |
否 |
預處理 |
歸一化 + SentencePiece (spm4k, spm4k) |
模型鏈接 |
[opus - 2020 - 06 - 16.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - afr/opus - 2020 - 06 - 16.zip) |
測試集鏈接 |
[opus - 2020 - 06 - 16.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - afr/opus - 2020 - 06 - 16.test.txt) |
源語言ISO 639 - 3代碼 |
epo |
目標語言ISO 639 - 3代碼 |
afr |
短語言對 |
eo - af |
chrF2得分 |
0.369 |
BLEU得分 |
19.5 |
簡潔懲罰 |
0.9570000000000001 |
參考長度 |
8432.0 |
源語言名稱 |
世界語 |
目標語言名稱 |
南非語 |
訓練日期 |
2020 - 06 - 16 |
源語言ISO 639 - 2代碼 |
eo |
目標語言ISO 639 - 2代碼 |
af |
是否偏好舊版本 |
否 |
長語言對 |
epo - afr |
赫爾辛基倉庫Git SHA |
480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535 |
Transformers倉庫Git SHA |
2207e5d8cb224e954a7cba69fa4ac2309e9ff30b |
移植機器 |
brutasse |
移植時間 |
2020 - 08 - 21 - 14:41 |
📄 許可證
本項目採用Apache - 2.0許可證。