🚀 英文 - 保加利亞語翻譯模型
本項目專注於英文到保加利亞語的翻譯任務,利用Transformer模型實現高效準確的翻譯。提供了模型的詳細信息、下載鏈接以及測試集評估結果等內容。
📚 詳細文檔
翻譯任務信息
- 源語言組:英語
- 目標語言組:保加利亞語
- OPUS說明文檔:[eng - bul](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/eng - bul/README.md)
模型信息
屬性 |
詳情 |
模型類型 |
Transformer |
源語言 |
英語 (eng) |
目標語言 |
保加利亞語 (bul)、拉丁字母書寫的保加利亞語 (bul_Latn) |
預處理 |
歸一化 + SentencePiece (spm32k, spm32k) |
語言標識要求 |
需要以 >>id<< 形式的句子初始語言標記(id = 有效的目標語言ID) |
原始權重下載 |
[opus - 2020 - 07 - 03.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/eng - bul/opus - 2020 - 07 - 03.zip) |
測試集翻譯 |
[opus - 2020 - 07 - 03.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/eng - bul/opus - 2020 - 07 - 03.test.txt) |
測試集評分 |
[opus - 2020 - 07 - 03.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/eng - bul/opus - 2020 - 07 - 03.eval.txt) |
基準測試結果
測試集 |
BLEU |
chr - F |
Tatoeba - test.eng.bul |
50.6 |
0.680 |
系統信息
- Hugging Face名稱:eng - bul
- 源語言:英語 (eng)
- 目標語言:保加利亞語 (bul)
- OPUS說明文檔鏈接:https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/eng - bul/README.md
- 原始倉庫:Tatoeba - Challenge
- 標籤:['翻譯']
- 語言:['en', 'bg']
- 源語言組成:{'eng'}
- 目標語言組成:{'bul', 'bul_Latn'}
- 源語言多語言特性:否
- 目標語言多語言特性:否
- 預處理:歸一化 + SentencePiece (spm32k, spm32k)
- 模型鏈接:https://object.pouta.csc.fi/Tatoeba - MT - models/eng - bul/opus - 2020 - 07 - 03.zip
- 測試集鏈接:https://object.pouta.csc.fi/Tatoeba - MT - models/eng - bul/opus - 2020 - 07 - 03.test.txt
- 源語言ISO 639 - 3代碼:eng
- 目標語言ISO 639 - 3代碼:bul
- 語言對簡稱:en - bg
- chrF2分數:0.68
- BLEU分數:50.6
- 簡潔懲罰係數:0.96
- 參考長度:69504.0
- 源語言名稱:英語
- 目標語言名稱:保加利亞語
- 訓練日期:2020 - 07 - 03
- 源語言ISO 639 - 2代碼:en
- 目標語言ISO 639 - 2代碼:bg
- 是否偏好舊版本:否
- 語言對全稱:eng - bul
- Helsinki Git提交哈希:480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- Transformers Git提交哈希:2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植機器:brutasse
- 移植時間:2020 - 08 - 21 - 14:41
📄 許可證
本項目採用Apache 2.0許可證。