🚀 日语 - 保加利亚语翻译项目
本项目专注于日语到保加利亚语的翻译,采用了特定的模型和预处理方式,为日语 - 保加利亚语的翻译任务提供了有效的解决方案。
📦 项目信息
属性 |
详情 |
源语言组 |
日语 |
目标语言组 |
保加利亚语 |
OPUS 说明文档 |
[jpn - bul](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/jpn - bul/README.md) |
模型类型 |
transformer - align |
源语言 |
jpn、jpn_Hani、jpn_Hira、jpn_Kana |
目标语言 |
bul |
预处理 |
归一化 + SentencePiece (spm32k,spm32k) |
原始权重下载 |
[opus - 2020 - 06 - 17.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/jpn - bul/opus - 2020 - 06 - 17.zip) |
测试集翻译 |
[opus - 2020 - 06 - 17.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/jpn - bul/opus - 2020 - 06 - 17.test.txt) |
测试集评分 |
[opus - 2020 - 06 - 17.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/jpn - bul/opus - 2020 - 06 - 17.eval.txt) |
📊 基准测试
测试集 |
BLEU |
chr - F |
Tatoeba - test.jpn.bul |
20.2 |
0.422 |
🔧 系统信息
- Hugging Face 名称:jpn - bul
- 源语言:jpn
- 目标语言:bul
- OPUS 说明文档 URL:https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/jpn - bul/README.md
- 原始仓库:Tatoeba - Challenge
- 标签:['translation']
- 语言:['ja', 'bg']
- 源语言组成:{'jpn_Hang', 'jpn', 'jpn_Yiii', 'jpn_Kana', 'jpn_Hani', 'jpn_Bopo', 'jpn_Latn', 'jpn_Hira'}
- 目标语言组成:{'bul', 'bul_Latn'}
- 源语言多语言支持:False
- 目标语言多语言支持:False
- 预处理:归一化 + SentencePiece (spm32k,spm32k)
- 模型 URL:https://object.pouta.csc.fi/Tatoeba - MT - models/jpn - bul/opus - 2020 - 06 - 17.zip
- 测试集 URL:https://object.pouta.csc.fi/Tatoeba - MT - models/jpn - bul/opus - 2020 - 06 - 17.test.txt
- 源语言 ISO 639 - 3 代码:jpn
- 目标语言 ISO 639 - 3 代码:bul
- 语言对简称:ja - bg
- chrF2 分数:0.42200000000000004
- BLEU 分数:20.2
- 简洁惩罚:0.9570000000000001
- 参考长度:2346.0
- 源语言名称:日语
- 目标语言名称:保加利亚语
- 训练日期:2020 - 06 - 17
- 源语言 ISO 639 - 2 代码:ja
- 目标语言 ISO 639 - 2 代码:bg
- 优先旧版本:False
- 语言对全称:jpn - bul
- 赫尔辛基代码库 SHA:480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- Transformers 代码库 SHA:2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植机器:brutasse
- 移植时间:2020 - 08 - 21 - 14:41
📄 许可证
本项目采用 Apache - 2.0 许可证。