🚀 eng-ine 英文到印歐語系翻譯模型
本項目是一個英文到印歐語系的翻譯模型,能夠將英文準確翻譯成多種印歐語系語言,為跨語言交流提供了有力支持。
🚀 快速開始
本模型是一個英文到印歐語系的翻譯模型,可用於將英文文本翻譯成多種印歐語系語言。你可以通過以下鏈接獲取模型的相關信息和資源:
✨ 主要特性
- 多語言支持:支持將英文翻譯成眾多印歐語系語言,包括但不限於阿拉伯語、阿爾巴尼亞語、古英語、阿根廷西班牙語、阿薩姆語等。
- 模型類型:採用 Transformer 模型架構。
- 預處理方式:使用歸一化和 SentencePiece(spm32k,spm32k)進行預處理。
- 語言標記:需要以
>>id<<
(id 為有效的目標語言 ID)形式的句子初始語言標記。
📚 詳細文檔
模型信息
屬性 |
詳情 |
源語言組 |
英語 |
目標語言組 |
印歐語系語言 |
模型類型 |
Transformer |
源語言 |
eng |
目標語言 |
afr aln ang_Latn arg asm ast awa bel bel_Latn ben bho bos_Latn bre bul bul_Latn cat ces cor cos csb_Latn cym dan deu dsb egl ell enm_Latn ext fao fra frm_Latn frr fry gcf_Latn gla gle glg glv gom gos got_Goth grc_Grek gsw guj hat hif_Latn hin hrv hsb hye ind isl ita jdt_Cyrl ksh kur_Arab kur_Latn lad lad_Latn lat_Latn lav lij lit lld_Latn lmo ltg ltz mai mar max_Latn mfe min mkd mwl nds nld nno nob nob_Hebr non_Latn npi oci ori orv_Cyrl oss pan_Guru pap pdc pes pes_Latn pes_Thaa pms pnb pol por prg_Latn pus roh rom ron rue rus san_Deva scn sco sgs sin slv snd_Arab spa sqi srp_Cyrl srp_Latn stq swe swg tgk_Cyrl tly_Latn tmw_Latn ukr urd vec wln yid zlm_Latn zsm_Latn zza |
預處理 |
歸一化 + SentencePiece (spm32k,spm32k) |
系統信息
- 模型名稱:eng-ine
- 源語言:eng
- 目標語言:ine
- OPUS 說明文檔鏈接:https://github.com/Helsinki-NLP/Tatoeba-Challenge/tree/master/models/eng-ine/README.md
- 原始倉庫:Tatoeba-Challenge
- 標籤:['translation']
- 支持語言:['en', 'ca', 'es', 'os', 'ro', 'fy', 'cy', 'sc', 'is', 'yi', 'lb', 'an', 'sq', 'fr', 'ht', 'rm', 'ps', 'af', 'uk', 'sl', 'lt', 'bg', 'be', 'gd', 'si', 'br', 'mk', 'or', 'mr', 'ru', 'fo', 'co', 'oc', 'pl', 'gl', 'nb', 'bn', 'id', 'hy', 'da', 'gv', 'nl', 'pt', 'hi', 'as', 'kw', 'ga', 'sv', 'gu', 'wa', 'lv', 'el', 'it', 'hr', 'ur', 'nn', 'de', 'cs', 'ine']
- 源語言成分:{'eng'}
- 目標語言成分:包含眾多印歐語系語言
- 源語言多語言性:False
- 目標語言多語言性:True
- 訓練日期:2020-08-01
基準測試
測試集 |
BLEU |
chr-F |
newsdev2014-enghin.eng.hin |
6.2 |
0.317 |
newsdev2016-enro-engron.eng.ron |
22.1 |
0.525 |
newsdev2017-enlv-englav.eng.lav |
17.4 |
0.486 |
... |
... |
... |
Tatoeba-test.eng-zza.eng.zza |
0.8 |
0.086 |
📄 許可證
本項目採用 Apache-2.0 許可證。