🚀 ara - spa
ara - spa 是一个专注于阿拉伯语到西班牙语的翻译项目,提供了特定的翻译模型及相关测试数据,可用于阿拉伯语与西班牙语之间的翻译任务。
✨ 主要特性
- 语言支持:支持从阿拉伯语(包括多种变体如 apc、apc_Latn、ara、arq 等)到西班牙语的翻译。
- 模型类型:采用 transformer 模型。
- 预处理方式:进行了归一化处理,并使用 SentencePiece(spm32k, spm32k)。
📚 详细文档
项目信息
- 源语言组:阿拉伯语
- 目标语言组:西班牙语
- OPUS 说明文档:[ara - spa](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/ara - spa/README.md)
模型相关
- 模型类型:transformer
- 源语言:apc、apc_Latn、ara、arq
- 目标语言:spa
- 预处理:归一化 + SentencePiece(spm32k, spm32k)
- 原始权重下载:[opus - 2020 - 07 - 03.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/ara - spa/opus - 2020 - 07 - 03.zip)
- 测试集翻译:[opus - 2020 - 07 - 03.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/ara - spa/opus - 2020 - 07 - 03.test.txt)
- 测试集分数:[opus - 2020 - 07 - 03.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/ara - spa/opus - 2020 - 07 - 03.eval.txt)
基准测试
测试集 |
BLEU |
chr - F |
Tatoeba - test.ara.spa |
46.0 |
0.641 |
系统信息
属性 |
详情 |
hf 名称 |
ara - spa |
源语言 |
ara |
目标语言 |
spa |
OPUS 说明文档链接 |
https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/ara - spa/README.md |
原始仓库 |
Tatoeba - Challenge |
标签 |
['translation'] |
语言 |
['ar', 'es'] |
源语言成分 |
{'apc', 'ara', 'arq_Latn', 'arq', 'afb', 'ara_Latn', 'apc_Latn', 'arz'} |
目标语言成分 |
{'spa'} |
源语言多语言特性 |
False |
目标语言多语言特性 |
False |
预处理 |
归一化 + SentencePiece(spm32k, spm32k) |
模型链接 |
https://object.pouta.csc.fi/Tatoeba - MT - models/ara - spa/opus - 2020 - 07 - 03.zip |
测试集链接 |
https://object.pouta.csc.fi/Tatoeba - MT - models/ara - spa/opus - 2020 - 07 - 03.test.txt |
源语言 ISO 639 - 3 代码 |
ara |
目标语言 ISO 639 - 3 代码 |
spa |
短语言对 |
ar - es |
chrF2 分数 |
0.6409999999999999 |
BLEU 分数 |
46.0 |
简洁惩罚系数 |
0.9620000000000001 |
参考长度 |
9708.0 |
源语言名称 |
阿拉伯语 |
目标语言名称 |
西班牙语 |
训练日期 |
2020 - 07 - 03 |
源语言 ISO 639 - 2 代码 |
ar |
目标语言 ISO 639 - 2 代码 |
es |
是否优先使用旧版本 |
False |
长语言对 |
ara - spa |
Helsinki Git SHA |
480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535 |
Transformers Git SHA |
2207e5d8cb224e954a7cba69fa4ac2309e9ff30b |
移植机器 |
brutasse |
移植时间 |
2020 - 08 - 21 - 14:41 |
📄 许可证
本项目采用 Apache - 2.0 许可证。