🚀 epo - afr翻译项目
本项目专注于从世界语(Esperanto)到南非语(Afrikaans)的翻译,采用了特定的模型和处理方式,为相关领域提供了有效的翻译解决方案。
✨ 主要特性
- 语言对明确:明确针对世界语到南非语的翻译任务。
- 模型选择:采用
transformer - align
模型进行翻译工作。
- 预处理方式:运用归一化(normalization)和SentencePiece(spm4k, spm4k)进行预处理。
📦 资源获取
- OPUS说明文档:[epo - afr](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/epo - afr/README.md)
- 原始权重下载:[opus - 2020 - 06 - 16.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - afr/opus - 2020 - 06 - 16.zip)
- 测试集翻译:[opus - 2020 - 06 - 16.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - afr/opus - 2020 - 06 - 16.test.txt)
- 测试集评分:[opus - 2020 - 06 - 16.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - afr/opus - 2020 - 06 - 16.eval.txt)
📚 详细文档
基准测试
测试集 |
BLEU |
chr - F |
Tatoeba - test.epo.afr |
19.5 |
0.369 |
系统信息
属性 |
详情 |
hf名称 |
epo - afr |
源语言 |
epo(世界语) |
目标语言 |
afr(南非语) |
OPUS说明文档链接 |
[epo - afr](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/epo - afr/README.md) |
原始仓库 |
Tatoeba - Challenge |
标签 |
['translation'] |
语言 |
['eo', 'af'] |
源语言成分 |
{'epo'} |
目标语言成分 |
{'afr'} |
源语言多语言性 |
否 |
目标语言多语言性 |
否 |
预处理 |
归一化 + SentencePiece (spm4k, spm4k) |
模型链接 |
[opus - 2020 - 06 - 16.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - afr/opus - 2020 - 06 - 16.zip) |
测试集链接 |
[opus - 2020 - 06 - 16.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/epo - afr/opus - 2020 - 06 - 16.test.txt) |
源语言ISO 639 - 3代码 |
epo |
目标语言ISO 639 - 3代码 |
afr |
短语言对 |
eo - af |
chrF2得分 |
0.369 |
BLEU得分 |
19.5 |
简洁惩罚 |
0.9570000000000001 |
参考长度 |
8432.0 |
源语言名称 |
世界语 |
目标语言名称 |
南非语 |
训练日期 |
2020 - 06 - 16 |
源语言ISO 639 - 2代码 |
eo |
目标语言ISO 639 - 2代码 |
af |
是否偏好旧版本 |
否 |
长语言对 |
epo - afr |
赫尔辛基仓库Git SHA |
480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535 |
Transformers仓库Git SHA |
2207e5d8cb224e954a7cba69fa4ac2309e9ff30b |
移植机器 |
brutasse |
移植时间 |
2020 - 08 - 21 - 14:41 |
📄 许可证
本项目采用Apache - 2.0许可证。