🚀 eng-ine 英文到印欧语系翻译模型
本项目是一个英文到印欧语系的翻译模型,能够将英文准确翻译成多种印欧语系语言,为跨语言交流提供了有力支持。
🚀 快速开始
本模型是一个英文到印欧语系的翻译模型,可用于将英文文本翻译成多种印欧语系语言。你可以通过以下链接获取模型的相关信息和资源:
✨ 主要特性
- 多语言支持:支持将英文翻译成众多印欧语系语言,包括但不限于阿拉伯语、阿尔巴尼亚语、古英语、阿根廷西班牙语、阿萨姆语等。
- 模型类型:采用 Transformer 模型架构。
- 预处理方式:使用归一化和 SentencePiece(spm32k,spm32k)进行预处理。
- 语言标记:需要以
>>id<<
(id 为有效的目标语言 ID)形式的句子初始语言标记。
📚 详细文档
模型信息
属性 |
详情 |
源语言组 |
英语 |
目标语言组 |
印欧语系语言 |
模型类型 |
Transformer |
源语言 |
eng |
目标语言 |
afr aln ang_Latn arg asm ast awa bel bel_Latn ben bho bos_Latn bre bul bul_Latn cat ces cor cos csb_Latn cym dan deu dsb egl ell enm_Latn ext fao fra frm_Latn frr fry gcf_Latn gla gle glg glv gom gos got_Goth grc_Grek gsw guj hat hif_Latn hin hrv hsb hye ind isl ita jdt_Cyrl ksh kur_Arab kur_Latn lad lad_Latn lat_Latn lav lij lit lld_Latn lmo ltg ltz mai mar max_Latn mfe min mkd mwl nds nld nno nob nob_Hebr non_Latn npi oci ori orv_Cyrl oss pan_Guru pap pdc pes pes_Latn pes_Thaa pms pnb pol por prg_Latn pus roh rom ron rue rus san_Deva scn sco sgs sin slv snd_Arab spa sqi srp_Cyrl srp_Latn stq swe swg tgk_Cyrl tly_Latn tmw_Latn ukr urd vec wln yid zlm_Latn zsm_Latn zza |
预处理 |
归一化 + SentencePiece (spm32k,spm32k) |
系统信息
- 模型名称:eng-ine
- 源语言:eng
- 目标语言:ine
- OPUS 说明文档链接:https://github.com/Helsinki-NLP/Tatoeba-Challenge/tree/master/models/eng-ine/README.md
- 原始仓库:Tatoeba-Challenge
- 标签:['translation']
- 支持语言:['en', 'ca', 'es', 'os', 'ro', 'fy', 'cy', 'sc', 'is', 'yi', 'lb', 'an', 'sq', 'fr', 'ht', 'rm', 'ps', 'af', 'uk', 'sl', 'lt', 'bg', 'be', 'gd', 'si', 'br', 'mk', 'or', 'mr', 'ru', 'fo', 'co', 'oc', 'pl', 'gl', 'nb', 'bn', 'id', 'hy', 'da', 'gv', 'nl', 'pt', 'hi', 'as', 'kw', 'ga', 'sv', 'gu', 'wa', 'lv', 'el', 'it', 'hr', 'ur', 'nn', 'de', 'cs', 'ine']
- 源语言成分:{'eng'}
- 目标语言成分:包含众多印欧语系语言
- 源语言多语言性:False
- 目标语言多语言性:True
- 训练日期:2020-08-01
基准测试
测试集 |
BLEU |
chr-F |
newsdev2014-enghin.eng.hin |
6.2 |
0.317 |
newsdev2016-enro-engron.eng.ron |
22.1 |
0.525 |
newsdev2017-enlv-englav.eng.lav |
17.4 |
0.486 |
... |
... |
... |
Tatoeba-test.eng-zza.eng.zza |
0.8 |
0.086 |
📄 许可证
本项目采用 Apache-2.0 许可证。