🚀 eng - fiu
- この翻訳モデルは英語(English)をフィン・ウゴル諸語(Finno - Ugrian languages)に変換するためのものです。
- 詳細なREADMEはeng - fiuを参照してください。
🚀 クイックスタート
このモデルはTransformerモデルを使用しており、英語から複数のフィン・ウゴル諸語への翻訳を行います。以下に必要な情報を示します。
✨ 主な機能
- 英語から複数のフィン・ウゴル諸語への翻訳を行うことができます。
- 前処理として、正規化とSentencePiece(spm32k, spm32k)を使用しています。
📦 インストール
このセクションでは具体的なインストール手順が提供されていないため、スキップします。
📚 ドキュメント
基本情報
属性 |
詳情 |
モデルタイプ |
Transformer |
ソース言語 |
eng |
ターゲット言語 |
est, fin, fkv_Latn, hun, izh, kpv, krl, liv_Latn, mdf, mhr, myv, sma, sme, udm, vro |
前処理 |
正規化 + SentencePiece (spm32k,spm32k) |
初期言語トークン |
>>id<< の形式が必要(id = 有効なターゲット言語ID) |
元の重みのダウンロード |
opus2m - 2020 - 08 - 01.zip |
テストセットの翻訳 |
opus2m - 2020 - 08 - 01.test.txt |
テストセットのスコア |
opus2m - 2020 - 08 - 01.eval.txt |
ベンチマーク
テストセット |
BLEU |
chr - F |
newsdev2015 - enfi - engfin.eng.fin |
18.7 |
0.522 |
newsdev2018 - enet - engest.eng.est |
19.4 |
0.521 |
newssyscomb2009 - enghun.eng.hun |
15.5 |
0.472 |
newstest2009 - enghun.eng.hun |
15.4 |
0.468 |
newstest2015 - enfi - engfin.eng.fin |
19.9 |
0.532 |
newstest2016 - enfi - engfin.eng.fin |
21.1 |
0.544 |
newstest2017 - enfi - engfin.eng.fin |
23.8 |
0.567 |
newstest2018 - enet - engest.eng.est |
20.4 |
0.532 |
newstest2018 - enfi - engfin.eng.fin |
15.6 |
0.498 |
newstest2019 - enfi - engfin.eng.fin |
20.0 |
0.520 |
newstestB2016 - enfi - engfin.eng.fin |
17.0 |
0.512 |
newstestB2017 - enfi - engfin.eng.fin |
19.7 |
0.531 |
Tatoeba - test.eng - chm.eng.chm |
0.9 |
0.115 |
Tatoeba - test.eng - est.eng.est |
49.8 |
0.689 |
Tatoeba - test.eng - fin.eng.fin |
34.7 |
0.597 |
Tatoeba - test.eng - fkv.eng.fkv |
1.3 |
0.187 |
Tatoeba - test.eng - hun.eng.hun |
35.2 |
0.589 |
Tatoeba - test.eng - izh.eng.izh |
6.0 |
0.163 |
Tatoeba - test.eng - kom.eng.kom |
3.4 |
0.012 |
Tatoeba - test.eng - krl.eng.krl |
6.4 |
0.202 |
Tatoeba - test.eng - liv.eng.liv |
1.6 |
0.102 |
Tatoeba - test.eng - mdf.eng.mdf |
3.7 |
0.008 |
Tatoeba - test.eng.multi |
35.4 |
0.590 |
Tatoeba - test.eng - myv.eng.myv |
1.4 |
0.014 |
Tatoeba - test.eng - sma.eng.sma |
2.6 |
0.097 |
Tatoeba - test.eng - sme.eng.sme |
7.3 |
0.221 |
Tatoeba - test.eng - udm.eng.udm |
1.4 |
0.079 |
システム情報
- hf_name: eng - fiu
- ソース言語: eng
- ターゲット言語: fiu
- OPUSのREADME URL: https://github.com/Helsinki-NLP/Tatoeba-Challenge/tree/master/models/eng-fiu/README.md
- 元のリポジトリ: Tatoeba - Challenge
- タグ: ['translation']
- 言語: ['en', 'se', 'fi', 'hu', 'et', 'fiu']
- ソース構成要素: {'eng'}
- ターゲット構成要素: {'izh', 'mdf', 'vep', 'vro', 'sme', 'myv', 'fkv_Latn', 'krl', 'fin', 'hun', 'kpv', 'udm', 'liv_Latn', 'est', 'mhr', 'sma'}
- ソースの多言語性: False
- ターゲットの多言語性: True
- 前処理: 正規化 + SentencePiece (spm32k,spm32k)
- モデルのURL: https://object.pouta.csc.fi/Tatoeba-MT-models/eng-fiu/opus2m-2020-08-01.zip
- テストセットのURL: https://object.pouta.csc.fi/Tatoeba-MT-models/eng-fiu/opus2m-2020-08-01.test.txt
- ソースの3文字言語コード: eng
- ターゲットの3文字言語コード: fiu
- 短い言語ペア: en - fiu
- chrF2スコア: 0.59
- BLEU: 35.4
- 簡潔ペナルティ: 0.9440000000000001
- 参照長: 59311.0
- ソース言語名: 英語
- ターゲット言語名: フィン・ウゴル諸語
- 学習日: 2020 - 08 - 01
- ソースの2文字言語コード: en
- ターゲットの2文字言語コード: fiu
- 古いバージョンの優先: False
- 長い言語ペア: eng - fiu
- HelsinkiのGit SHA: 480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- TransformersのGit SHA: 2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植先マシン: brutasse
- 移植時間: 2020 - 08 - 21 - 14:41
📄 ライセンス
このプロジェクトはApache - 2.0ライセンスの下で提供されています。