🚀 ilo - eng 翻译项目
本项目专注于伊洛卡诺语(Iloko)到英语(English)的翻译任务,提供了相应的翻译模型及测试集,能有效助力伊洛卡诺语与英语之间的语言转换。
✨ 主要特性
- 语言对明确:精准针对伊洛卡诺语到英语的翻译。
- 模型类型:采用
transformer - align
模型。
- 预处理方式:运用归一化(normalization)和 SentencePiece(spm12k,spm12k)进行预处理。
📦 安装指南
原文档未提供具体安装步骤,故跳过此章节。
💻 使用示例
原文档未提供代码示例,故跳过此章节。
📚 详细文档
基本信息
属性 |
详情 |
源语言组 |
伊洛卡诺语(Iloko) |
目标语言组 |
英语(English) |
OPUS 说明文档 |
[ilo - eng](https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/ilo - eng/README.md) |
模型类型 |
transformer - align |
源语言 |
ilo |
目标语言 |
eng |
预处理 |
归一化 + SentencePiece (spm12k,spm12k) |
原始权重下载 |
[opus - 2020 - 06 - 16.zip](https://object.pouta.csc.fi/Tatoeba - MT - models/ilo - eng/opus - 2020 - 06 - 16.zip) |
测试集翻译 |
[opus - 2020 - 06 - 16.test.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/ilo - eng/opus - 2020 - 06 - 16.test.txt) |
测试集分数 |
[opus - 2020 - 06 - 16.eval.txt](https://object.pouta.csc.fi/Tatoeba - MT - models/ilo - eng/opus - 2020 - 06 - 16.eval.txt) |
基准测试
测试集 |
BLEU |
chr - F |
Tatoeba - test.ilo.eng |
36.4 |
0.558 |
系统信息
- 模型名称:ilo - eng
- 源语言:ilo(伊洛卡诺语)
- 目标语言:eng(英语)
- OPUS 说明文档链接:https://github.com/Helsinki - NLP/Tatoeba - Challenge/tree/master/models/ilo - eng/README.md
- 原始仓库:Tatoeba - Challenge
- 标签:['translation']
- 语言:['ilo', 'en']
- 源语言成分:{'ilo'}
- 目标语言成分:{'eng'}
- 源语言多语言性:False
- 目标语言多语言性:False
- 预处理:归一化 + SentencePiece (spm12k,spm12k)
- 模型链接:https://object.pouta.csc.fi/Tatoeba - MT - models/ilo - eng/opus - 2020 - 06 - 16.zip
- 测试集链接:https://object.pouta.csc.fi/Tatoeba - MT - models/ilo - eng/opus - 2020 - 06 - 16.test.txt
- 源语言 ISO 639 - 3 代码:ilo
- 目标语言 ISO 639 - 3 代码:eng
- 短语言对:ilo - en
- chrF2 分数:0.5579999999999999
- BLEU 分数:36.4
- 简短惩罚:1.0
- 参考长度:7384.0
- 源语言名称:Iloko
- 目标语言名称:English
- 训练日期:2020 - 06 - 16
- 源语言 ISO 639 - 2 代码:ilo
- 目标语言 ISO 639 - 2 代码:en
- 是否偏好旧版本:False
- 长语言对:ilo - eng
- 赫尔辛基代码库 SHA:480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- transformers 代码库 SHA:2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植机器:brutasse
- 移植时间:2020 - 08 - 21 - 14:41
🔧 技术细节
原文档未提供具体技术实现细节,故跳过此章节。
📄 许可证
本项目采用 Apache - 2.0 许可证。