🚀 ウェストゲルマン語派から英語への翻訳モデル
このプロジェクトは、ウェストゲルマン語派の言語を英語に翻訳するためのモデルを提供します。高精度の翻訳を実現し、多様なテストセットでの評価結果を公開しています。
🚀 クイックスタート
この翻訳モデルは、ウェストゲルマン語派の言語(afr
, ang_Latn
, deu
など)を英語に翻訳することができます。以下にモデルの詳細情報を示します。
モデル情報
属性 |
詳情 |
モデルタイプ |
Transformer |
ソース言語群 |
ウェストゲルマン語派(afr , ang_Latn , deu , enm_Latn , frr , fry , gos , gsw , ksh , ltz , nds , nld , pdc , sco , stq , swg , yid ) |
ターゲット言語 |
英語(eng ) |
前処理 |
正規化 + SentencePiece (spm32k,spm32k) |
オリジナルの重みダウンロード |
opus2m-2020-08-01.zip |
テストセットの翻訳結果 |
opus2m-2020-08-01.test.txt |
テストセットのスコア |
opus2m-2020-08-01.eval.txt |
ベンチマーク
テストセット |
BLEU |
chr-F |
newssyscomb2009-deueng.deu.eng |
27.2 |
0.538 |
news-test2008-deueng.deu.eng |
25.7 |
0.534 |
newstest2009-deueng.deu.eng |
25.1 |
0.530 |
newstest2010-deueng.deu.eng |
27.9 |
0.565 |
newstest2011-deueng.deu.eng |
25.3 |
0.539 |
newstest2012-deueng.deu.eng |
26.6 |
0.548 |
newstest2013-deueng.deu.eng |
29.6 |
0.565 |
newstest2014-deen-deueng.deu.eng |
30.2 |
0.571 |
newstest2015-ende-deueng.deu.eng |
31.5 |
0.577 |
newstest2016-ende-deueng.deu.eng |
36.7 |
0.622 |
newstest2017-ende-deueng.deu.eng |
32.3 |
0.585 |
newstest2018-ende-deueng.deu.eng |
39.9 |
0.638 |
newstest2019-deen-deueng.deu.eng |
35.9 |
0.611 |
Tatoeba-test.afr-eng.afr.eng |
61.8 |
0.750 |
Tatoeba-test.ang-eng.ang.eng |
7.3 |
0.220 |
Tatoeba-test.deu-eng.deu.eng |
48.3 |
0.657 |
Tatoeba-test.enm-eng.enm.eng |
16.1 |
0.423 |
Tatoeba-test.frr-eng.frr.eng |
7.0 |
0.168 |
Tatoeba-test.fry-eng.fry.eng |
28.6 |
0.488 |
Tatoeba-test.gos-eng.gos.eng |
15.5 |
0.326 |
Tatoeba-test.gsw-eng.gsw.eng |
12.7 |
0.308 |
Tatoeba-test.ksh-eng.ksh.eng |
8.4 |
0.254 |
Tatoeba-test.ltz-eng.ltz.eng |
28.7 |
0.453 |
Tatoeba-test.multi.eng |
48.5 |
0.646 |
Tatoeba-test.nds-eng.nds.eng |
31.4 |
0.509 |
Tatoeba-test.nld-eng.nld.eng |
58.1 |
0.728 |
Tatoeba-test.pdc-eng.pdc.eng |
25.1 |
0.406 |
Tatoeba-test.sco-eng.sco.eng |
40.8 |
0.570 |
Tatoeba-test.stq-eng.stq.eng |
20.3 |
0.380 |
Tatoeba-test.swg-eng.swg.eng |
20.5 |
0.315 |
Tatoeba-test.yid-eng.yid.eng |
16.0 |
0.366 |
システム情報
- hf_name: gmw-eng
- ソース言語: gmw
- ターゲット言語: eng
- OPUSのREADME URL: https://github.com/Helsinki-NLP/Tatoeba-Challenge/tree/master/models/gmw-eng/README.md
- オリジナルリポジトリ: Tatoeba-Challenge
- タグ: ['translation']
- 言語: ['nl', 'en', 'lb', 'af', 'de', 'fy', 'yi', 'gmw']
- ソース言語の構成要素: {'ksh', 'nld', 'eng', 'enm_Latn', 'ltz', 'stq', 'afr', 'pdc', 'deu', 'gos', 'ang_Latn', 'fry', 'gsw', 'frr', 'nds', 'yid', 'swg', 'sco'}
- ターゲット言語の構成要素: {'eng'}
- ソース言語の多言語性: True
- ターゲット言語の多言語性: False
- 前処理: 正規化 + SentencePiece (spm32k,spm32k)
- モデルのURL: https://object.pouta.csc.fi/Tatoeba-MT-models/gmw-eng/opus2m-2020-08-01.zip
- テストセットのURL: https://object.pouta.csc.fi/Tatoeba-MT-models/gmw-eng/opus2m-2020-08-01.test.txt
- ソース言語のISO 639-3コード: gmw
- ターゲット言語のISO 639-3コード: eng
- 短い言語ペア: gmw-en
- chrF2スコア: 0.6459999999999999
- BLEUスコア: 48.5
- 簡略化ペナルティ: 0.997
- 参照文の長さ: 72584.0
- ソース言語名: ウェストゲルマン語派
- ターゲット言語名: 英語
- 学習日: 2020-08-01
- ソース言語のISO 639-2コード: gmw
- ターゲット言語のISO 639-2コード: en
- 古いバージョンの優先: False
- 長い言語ペア: gmw-eng
- HelsinkiのGit SHA: 480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- TransformersのGit SHA: 2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植先マシン: brutasse
- 移植時間: 2020-08-21-14:41
📄 ライセンス
このプロジェクトは、Apache-2.0ライセンスの下で公開されています。