🚀 epo - bul 翻譯模型
本項目是一個用於從世界語(Esperanto)到保加利亞語(Bulgarian)翻譯的模型,提供了模型的相關信息、基準測試結果以及系統信息等內容。
✨ 主要特性
- 支持從世界語到保加利亞語的翻譯。
- 採用
transformer - align
模型。
- 經過歸一化和 SentencePiece 預處理。
📚 詳細文檔
模型基本信息
- 源語言組:世界語(Esperanto)
- 目標語言組:保加利亞語(Bulgarian)
- OPUS 自述文件:[epo - bul](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/epo - bul/README.md)
- 模型:transformer - align
- 源語言:epo
- 目標語言:bul
- 預處理:歸一化 + SentencePiece (spm4k, spm4k)
- 下載原始權重:[opus - 2020 - 06 - 16.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - bul/opus - 2020 - 06 - 16.zip)
- 測試集翻譯:[opus - 2020 - 06 - 16.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - bul/opus - 2020 - 06 - 16.test.txt)
- 測試集分數:[opus - 2020 - 06 - 16.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - bul/opus - 2020 - 06 - 16.eval.txt)
基準測試
測試集 |
BLEU |
chr - F |
Tatoeba - test.epo.bul |
19.0 |
0.395 |
系統信息
屬性 |
詳情 |
hf_name |
epo - bul |
源語言 |
epo |
目標語言 |
bul |
opus_readme_url |
https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/epo - bul/README.md |
原始倉庫 |
Tatoeba - Challenge |
標籤 |
['translation'] |
語言 |
['eo', 'bg'] |
源語言成分 |
{'epo'} |
目標語言成分 |
{'bul', 'bul_Latn'} |
源語言多語言 |
False |
目標語言多語言 |
False |
預處理 |
歸一化 + SentencePiece (spm4k, spm4k) |
模型鏈接 |
https://object.pouta.csc.fi/Tatoeba - MT - models/epo - bul/opus - 2020 - 06 - 16.zip |
測試集鏈接 |
https://object.pouta.csc.fi/Tatoeba - MT - models/epo - bul/opus - 2020 - 06 - 16.test.txt |
源語言 ISO 639 - 3 代碼 |
epo |
目標語言 ISO 639 - 3 代碼 |
bul |
短語言對 |
eo - bg |
chrF2 分數 |
0.395 |
BLEU 分數 |
19.0 |
簡潔懲罰係數 |
0.8909999999999999 |
參考長度 |
3961.0 |
源語言名稱 |
Esperanto |
目標語言名稱 |
Bulgarian |
訓練日期 |
2020 - 06 - 16 |
源語言 ISO 639 - 2 代碼 |
eo |
目標語言 ISO 639 - 2 代碼 |
bg |
是否優先舊版本 |
False |
長語言對 |
epo - bul |
helsinki_git_sha |
480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535 |
transformers_git_sha |
2207e5d8cb224e954a7cba69fa4ac2309e9ff30b |
移植機器 |
brutasse |
移植時間 |
2020 - 08 - 21 - 14:41 |
📄 許可證
本項目採用 Apache - 2.0 許可證。