🚀 epo - bul 翻译模型
本项目是一个用于从世界语(Esperanto)到保加利亚语(Bulgarian)翻译的模型,提供了模型的相关信息、基准测试结果以及系统信息等内容。
✨ 主要特性
- 支持从世界语到保加利亚语的翻译。
- 采用
transformer - align
模型。
- 经过归一化和 SentencePiece 预处理。
📚 详细文档
模型基本信息
- 源语言组:世界语(Esperanto)
- 目标语言组:保加利亚语(Bulgarian)
- OPUS 自述文件:[epo - bul](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/epo - bul/README.md)
- 模型:transformer - align
- 源语言:epo
- 目标语言:bul
- 预处理:归一化 + SentencePiece (spm4k, spm4k)
- 下载原始权重:[opus - 2020 - 06 - 16.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - bul/opus - 2020 - 06 - 16.zip)
- 测试集翻译:[opus - 2020 - 06 - 16.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - bul/opus - 2020 - 06 - 16.test.txt)
- 测试集分数:[opus - 2020 - 06 - 16.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - bul/opus - 2020 - 06 - 16.eval.txt)
基准测试
测试集 |
BLEU |
chr - F |
Tatoeba - test.epo.bul |
19.0 |
0.395 |
系统信息
属性 |
详情 |
hf_name |
epo - bul |
源语言 |
epo |
目标语言 |
bul |
opus_readme_url |
https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/epo - bul/README.md |
原始仓库 |
Tatoeba - Challenge |
标签 |
['translation'] |
语言 |
['eo', 'bg'] |
源语言成分 |
{'epo'} |
目标语言成分 |
{'bul', 'bul_Latn'} |
源语言多语言 |
False |
目标语言多语言 |
False |
预处理 |
归一化 + SentencePiece (spm4k, spm4k) |
模型链接 |
https://object.pouta.csc.fi/Tatoeba - MT - models/epo - bul/opus - 2020 - 06 - 16.zip |
测试集链接 |
https://object.pouta.csc.fi/Tatoeba - MT - models/epo - bul/opus - 2020 - 06 - 16.test.txt |
源语言 ISO 639 - 3 代码 |
epo |
目标语言 ISO 639 - 3 代码 |
bul |
短语言对 |
eo - bg |
chrF2 分数 |
0.395 |
BLEU 分数 |
19.0 |
简洁惩罚系数 |
0.8909999999999999 |
参考长度 |
3961.0 |
源语言名称 |
Esperanto |
目标语言名称 |
Bulgarian |
训练日期 |
2020 - 06 - 16 |
源语言 ISO 639 - 2 代码 |
eo |
目标语言 ISO 639 - 2 代码 |
bg |
是否优先旧版本 |
False |
长语言对 |
epo - bul |
helsinki_git_sha |
480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535 |
transformers_git_sha |
2207e5d8cb224e954a7cba69fa4ac2309e9ff30b |
移植机器 |
brutasse |
移植时间 |
2020 - 08 - 21 - 14:41 |
📄 许可证
本项目采用 Apache - 2.0 许可证。