🚀 aze - tur翻译模型
本项目专注于阿塞拜疆语(Azerbaijani)到土耳其语(Turkish)的翻译,使用了特定的模型和预处理技术,提供了测试集和评估分数等信息。
✨ 主要特性
- 支持阿塞拜疆语到土耳其语的翻译。
- 采用
transformer - align
模型。
- 预处理步骤包括归一化和SentencePiece处理。
📚 详细文档
模型基本信息
属性 |
详情 |
源语言组 |
阿塞拜疆语 |
目标语言组 |
土耳其语 |
OPUS说明文档 |
[aze - tur](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/aze - tur/README.md) |
模型类型 |
transformer - align |
源语言 |
aze_Latn |
目标语言 |
tur |
预处理 |
归一化 + SentencePiece (spm4k,spm4k) |
原始权重下载 |
[opus - 2020 - 06 - 16.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/aze - tur/opus - 2020 - 06 - 16.zip) |
测试集翻译 |
[opus - 2020 - 06 - 16.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/aze - tur/opus - 2020 - 06 - 16.test.txt) |
测试集分数 |
[opus - 2020 - 06 - 16.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/aze - tur/opus - 2020 - 06 - 16.eval.txt) |
系统信息
- Hugging Face名称:aze - tur
- 源语言:aze
- 目标语言:tur
- OPUS说明文档URL:https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/aze - tur/README.md
- 原始仓库:Tatoeba - Challenge
- 标签:['translation']
- 语言:['az', 'tr']
- 源语言成分:{'aze_Latn'}
- 目标语言成分:{'tur'}
- 源语言多语言性:False
- 目标语言多语言性:False
- 预处理:归一化 + SentencePiece (spm4k,spm4k)
- 模型URL:https://object.pouta.csc.fi/Tatoeba - MT - models/aze - tur/opus - 2020 - 06 - 16.zip
- 测试集URL:https://object.pouta.csc.fi/Tatoeba - MT - models/aze - tur/opus - 2020 - 06 - 16.test.txt
- 源语言ISO 639 - 3代码:aze
- 目标语言ISO 639 - 3代码:tur
- 短语言对:az - tr
- chrF2分数:0.529
- BLEU分数:24.4
- 简洁惩罚:0.956
- 参考长度:5380.0
- 源语言名称:阿塞拜疆语
- 目标语言名称:土耳其语
- 训练日期:2020 - 06 - 16
- 源语言ISO 639 - 2代码:az
- 目标语言ISO 639 - 2代码:tr
- 是否偏好旧版本:False
- 长语言对:aze - tur
- Helsinki Git SHA:480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- Transformers Git SHA:2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植机器:brutasse
- 移植时间:2020 - 08 - 21 - 14:41
📊 基准测试
测试集 |
BLEU分数 |
chr - F分数 |
Tatoeba - test.aze.tur |
24.4 |
0.529 |
📄 许可证
本项目采用Apache - 2.0许可证。