🚀 英文 - 保加利亚语翻译模型
本项目专注于英文到保加利亚语的翻译任务,利用Transformer模型实现高效准确的翻译。提供了模型的详细信息、下载链接以及测试集评估结果等内容。
📚 详细文档
翻译任务信息
- 源语言组:英语
- 目标语言组:保加利亚语
- OPUS说明文档:[eng - bul](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/eng - bul/README.md)
模型信息
属性 |
详情 |
模型类型 |
Transformer |
源语言 |
英语 (eng) |
目标语言 |
保加利亚语 (bul)、拉丁字母书写的保加利亚语 (bul_Latn) |
预处理 |
归一化 + SentencePiece (spm32k, spm32k) |
语言标识要求 |
需要以 >>id<< 形式的句子初始语言标记(id = 有效的目标语言ID) |
原始权重下载 |
[opus - 2020 - 07 - 03.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/eng - bul/opus - 2020 - 07 - 03.zip) |
测试集翻译 |
[opus - 2020 - 07 - 03.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/eng - bul/opus - 2020 - 07 - 03.test.txt) |
测试集评分 |
[opus - 2020 - 07 - 03.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/eng - bul/opus - 2020 - 07 - 03.eval.txt) |
基准测试结果
测试集 |
BLEU |
chr - F |
Tatoeba - test.eng.bul |
50.6 |
0.680 |
系统信息
- Hugging Face名称:eng - bul
- 源语言:英语 (eng)
- 目标语言:保加利亚语 (bul)
- OPUS说明文档链接:https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/eng - bul/README.md
- 原始仓库:Tatoeba - Challenge
- 标签:['翻译']
- 语言:['en', 'bg']
- 源语言组成:{'eng'}
- 目标语言组成:{'bul', 'bul_Latn'}
- 源语言多语言特性:否
- 目标语言多语言特性:否
- 预处理:归一化 + SentencePiece (spm32k, spm32k)
- 模型链接:https://object.pouta.csc.fi/Tatoeba - MT - models/eng - bul/opus - 2020 - 07 - 03.zip
- 测试集链接:https://object.pouta.csc.fi/Tatoeba - MT - models/eng - bul/opus - 2020 - 07 - 03.test.txt
- 源语言ISO 639 - 3代码:eng
- 目标语言ISO 639 - 3代码:bul
- 语言对简称:en - bg
- chrF2分数:0.68
- BLEU分数:50.6
- 简洁惩罚系数:0.96
- 参考长度:69504.0
- 源语言名称:英语
- 目标语言名称:保加利亚语
- 训练日期:2020 - 07 - 03
- 源语言ISO 639 - 2代码:en
- 目标语言ISO 639 - 2代码:bg
- 是否偏好旧版本:否
- 语言对全称:eng - bul
- Helsinki Git提交哈希:480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- Transformers Git提交哈希:2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植机器:brutasse
- 移植时间:2020 - 08 - 21 - 14:41
📄 许可证
本项目采用Apache 2.0许可证。