🚀 art-eng
art-engは、人工言語を英語に翻訳するためのモデルです。様々な人工言語に対応し、Transformerアーキテクチャを使用して訓練されています。
🚀 クイックスタート
このモデルは、人工言語から英語への翻訳を行うために設計されています。以下の情報を参考に、モデルを利用することができます。
モデル情報
属性 |
详情 |
モデルタイプ |
Transformer |
ソース言語 |
afh_Latn, avk_Latn, dws_Latn, epo, ido, ido_Latn, ile_Latn, ina_Latn, jbo, jbo_Cyrl, jbo_Latn, ldn_Latn, lfn_Cyrl, lfn_Latn, nov_Latn, qya, qya_Latn, sjn_Latn, tlh_Latn, tzl, tzl_Latn, vol_Latn |
ターゲット言語 |
eng |
前処理 |
正規化 + SentencePiece (spm32k,spm32k) |
元の重みのダウンロード |
opus2m-2020-07-31.zip |
テストセットの翻訳 |
opus2m-2020-07-31.test.txt |
テストセットのスコア |
opus2m-2020-07-31.eval.txt |
ベンチマーク
テストセット |
BLEU |
chr-F |
Tatoeba-test.afh-eng.afh.eng |
1.2 |
0.099 |
Tatoeba-test.avk-eng.avk.eng |
0.4 |
0.105 |
Tatoeba-test.dws-eng.dws.eng |
1.6 |
0.076 |
Tatoeba-test.epo-eng.epo.eng |
34.6 |
0.530 |
Tatoeba-test.ido-eng.ido.eng |
12.7 |
0.310 |
Tatoeba-test.ile-eng.ile.eng |
4.6 |
0.218 |
Tatoeba-test.ina-eng.ina.eng |
5.8 |
0.254 |
Tatoeba-test.jbo-eng.jbo.eng |
0.2 |
0.115 |
Tatoeba-test.ldn-eng.ldn.eng |
0.7 |
0.083 |
Tatoeba-test.lfn-eng.lfn.eng |
1.8 |
0.172 |
Tatoeba-test.multi.eng |
11.6 |
0.287 |
Tatoeba-test.nov-eng.nov.eng |
5.1 |
0.215 |
Tatoeba-test.qya-eng.qya.eng |
0.7 |
0.113 |
Tatoeba-test.sjn-eng.sjn.eng |
0.9 |
0.090 |
Tatoeba-test.tlh-eng.tlh.eng |
0.2 |
0.124 |
Tatoeba-test.tzl-eng.tzl.eng |
1.4 |
0.109 |
Tatoeba-test.vol-eng.vol.eng |
0.5 |
0.115 |
システム情報
- hf_name: art-eng
- ソース言語: art
- ターゲット言語: eng
- OPUSのREADME URL: art-eng
- 元のリポジトリ: Tatoeba-Challenge
- タグ: ['translation']
- 言語: ['eo', 'io', 'art', 'en']
- ソース構成要素: {'sjn_Latn', 'tzl', 'vol_Latn', 'qya', 'tlh_Latn', 'ile_Latn', 'ido_Latn', 'tzl_Latn', 'jbo_Cyrl', 'jbo', 'lfn_Latn', 'nov_Latn', 'dws_Latn', 'ldn_Latn', 'avk_Latn', 'lfn_Cyrl', 'ina_Latn', 'jbo_Latn', 'epo', 'afh_Latn', 'qya_Latn', 'ido'}
- ターゲット構成要素: {'eng'}
- ソースの多言語対応: True
- ターゲットの多言語対応: False
- 前処理: 正規化 + SentencePiece (spm32k,spm32k)
- モデルのURL: https://object.pouta.csc.fi/Tatoeba-MT-models/art-eng/opus2m-2020-07-31.zip
- テストセットのURL: https://object.pouta.csc.fi/Tatoeba-MT-models/art-eng/opus2m-2020-07-31.test.txt
- ソース言語のISO 639-3コード: art
- ターゲット言語のISO 639-3コード: eng
- 言語ペアの短縮形: art-en
- chrF2スコア: 0.287
- BLEUスコア: 11.6
- 簡略化ペナルティ: 1.0
- 参照文の長さ: 73037.0
- ソース言語名: 人工言語
- ターゲット言語名: 英語
- 訓練日: 2020-07-31
- ソース言語のISO 639-2コード: art
- ターゲット言語のISO 639-2コード: en
- 古いバージョンを優先: False
- 言語ペアの長い形: art-eng
- Helsinki Git SHA: 480fcbe0ee1bf4774bcbe6226ad9f58e63f6c535
- Transformers Git SHA: 2207e5d8cb224e954a7cba69fa4ac2309e9ff30b
- 移植先マシン: brutasse
- 移植時間: 2020-08-21-14:41
📄 ライセンス
このモデルは、Apache-2.0ライセンスの下で提供されています。