🚀 eng-sit
- このモデルは英語(English)を漢藏語系(Sino - Tibetan languages)に翻訳するためのものです。
- OPUSのREADMEはeng - sitから参照できます。
🚀 クイックスタート
このモデルは英語を漢藏語系の複数の言語に翻訳するために開発されました。以下にモデルの詳細情報を示します。
✨ 主な機能
- 英語から漢藏語系の複数の言語への翻訳をサポートします。
- 前処理として、正規化とSentencePiece(spm32k, spm32k)を使用しています。
📦 インストール
モデルのオリジナルウェイトはopus2m - 2020 - 08 - 01.zipからダウンロードできます。
📚 ドキュメント
基本情報
属性 |
详情 |
モデルタイプ |
Transformer |
ソース言語 |
eng |
ターゲット言語 |
bod, brx, brx_Latn, cjy_Hans, cjy_Hant, cmn, cmn_Hans, cmn_Hant, gan, lzh, lzh_Hans, mya, nan, wuu, yue, yue_Hans, yue_Hant, zho, zho_Hans, zho_Hant |
前処理 |
正規化 + SentencePiece (spm32k,spm32k) |
翻訳テストセット |
opus2m - 2020 - 08 - 01.test.txt |
テストセットのスコア |
opus2m - 2020 - 08 - 01.eval.txt |
ベンチマーク
テストセット |
BLEU |
chr - F |
newsdev2017 - enzh - engzho.eng.zho |
23.5 |
0.217 |
newstest2017 - enzh - engzho.eng.zho |
23.2 |
0.223 |
newstest2018 - enzh - engzho.eng.zho |
25.0 |
0.230 |
newstest2019 - enzh - engzho.eng.zho |
20.2 |
0.225 |
Tatoeba - test.eng - bod.eng.bod |
0.4 |
0.147 |
Tatoeba - test.eng - brx.eng.brx |
0.5 |
0.012 |
Tatoeba - test.eng.multi |
25.7 |
0.223 |
Tatoeba - test.eng - mya.eng.mya |
0.2 |
0.222 |
Tatoeba - test.eng - zho.eng.zho |
29.2 |
0.249 |
システム情報
- hf_name: eng - sit
- ソース言語: eng
- ターゲット言語: sit
- OPUSのREADME URL: https://github.com/Helsinki-NLP/Tatoeba-Challenge/tree/master/models/eng-sit/README.md
- オリジナルリポジトリ: Tatoeba - Challenge
- タグ: ['translation']
- 言語: ['en', 'sit']
- ソース言語構成要素: {'eng'}
- ターゲット言語構成要素: set()
- ソース言語の多言語対応: False
- ターゲット言語の多言語対応: True
- 前処理: 正規化 + SentencePiece (spm32k,spm32k)
- モデルのURL: https://object.pouta.csc.fi/Tatoeba-MT-models/eng-sit/opus2m-2020-08-01.zip
- テストセットのURL: https://object.pouta.csc.fi/Tatoeba-MT-models/eng-sit/opus2m-2020-08-01.test.txt
- ソース言語のISO 639 - 3コード: eng
- ターゲット言語のISO 639 - 3コード: sit
- 短い言語ペア: en - sit
- chrF2スコア: 0.223
- BLEUスコア: 25.7
- 簡略化ペナルティ: 0.907
- 参照長: 109538.0
- ソース言語名: English
- ターゲット言語名: Sino - Tibetan languages
- 学習日: 2020 - 08 - 01
- ソース言語のISO 639 - 2コード: en
- ターゲット言語のISO 639 - 2コード: sit
- 古いバージョンの優先: False
- 長い言語ペア: eng - sit
- HelsinkiのGit SHA: 480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- TransformersのGit SHA: 2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植マシン: brutasse
- 移植時間: 2020 - 08 - 21 - 14:41
📄 ライセンス
このプロジェクトはApache - 2.0ライセンスの下で公開されています。