🚀 日語 - 保加利亞語翻譯項目
本項目專注於日語到保加利亞語的翻譯,採用了特定的模型和預處理方式,為日語 - 保加利亞語的翻譯任務提供了有效的解決方案。
📦 項目信息
屬性 |
詳情 |
源語言組 |
日語 |
目標語言組 |
保加利亞語 |
OPUS 說明文檔 |
[jpn - bul](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/jpn - bul/README.md) |
模型類型 |
transformer - align |
源語言 |
jpn、jpn_Hani、jpn_Hira、jpn_Kana |
目標語言 |
bul |
預處理 |
歸一化 + SentencePiece (spm32k,spm32k) |
原始權重下載 |
[opus - 2020 - 06 - 17.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/jpn - bul/opus - 2020 - 06 - 17.zip) |
測試集翻譯 |
[opus - 2020 - 06 - 17.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/jpn - bul/opus - 2020 - 06 - 17.test.txt) |
測試集評分 |
[opus - 2020 - 06 - 17.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/jpn - bul/opus - 2020 - 06 - 17.eval.txt) |
📊 基準測試
測試集 |
BLEU |
chr - F |
Tatoeba - test.jpn.bul |
20.2 |
0.422 |
🔧 系統信息
- Hugging Face 名稱:jpn - bul
- 源語言:jpn
- 目標語言:bul
- OPUS 說明文檔 URL:https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/jpn - bul/README.md
- 原始倉庫:Tatoeba - Challenge
- 標籤:['translation']
- 語言:['ja', 'bg']
- 源語言組成:{'jpn_Hang', 'jpn', 'jpn_Yiii', 'jpn_Kana', 'jpn_Hani', 'jpn_Bopo', 'jpn_Latn', 'jpn_Hira'}
- 目標語言組成:{'bul', 'bul_Latn'}
- 源語言多語言支持:False
- 目標語言多語言支持:False
- 預處理:歸一化 + SentencePiece (spm32k,spm32k)
- 模型 URL:https://object.pouta.csc.fi/Tatoeba - MT - models/jpn - bul/opus - 2020 - 06 - 17.zip
- 測試集 URL:https://object.pouta.csc.fi/Tatoeba - MT - models/jpn - bul/opus - 2020 - 06 - 17.test.txt
- 源語言 ISO 639 - 3 代碼:jpn
- 目標語言 ISO 639 - 3 代碼:bul
- 語言對簡稱:ja - bg
- chrF2 分數:0.42200000000000004
- BLEU 分數:20.2
- 簡潔懲罰:0.9570000000000001
- 參考長度:2346.0
- 源語言名稱:日語
- 目標語言名稱:保加利亞語
- 訓練日期:2020 - 06 - 17
- 源語言 ISO 639 - 2 代碼:ja
- 目標語言 ISO 639 - 2 代碼:bg
- 優先舊版本:False
- 語言對全稱:jpn - bul
- 赫爾辛基代碼庫 SHA:480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- Transformers 代碼庫 SHA:2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植機器:brutasse
- 移植時間:2020 - 08 - 21 - 14:41
📄 許可證
本項目採用 Apache - 2.0 許可證。