ct2fast-opus-mt-ROMANCE-enオープンソース翻訳モデル - 多言語のロマンス語から英語への高速翻訳を無料で実現

ホーム

Ct2fast Opus Mt ROMANCE En

michaelfeilによって開発

これはCTranslate2で最適化された多言語翻訳モデルで、複数のロマンス語派の言語から英語への高速翻訳をサポートします。

機械翻訳

Transformers

オープンソースライセンス:Apache-2.0 #ロマンス語派翻訳 #多言語対応 #高速推論

ダウンロード数 74

リリース時間 : 5/19/2023

モデル概要

このモデルはHelsinki - NLP/opus - mt - ROMANCE - enの量子化バージョンで、C++のint8推論により2～8倍の推論速度向上を実現します。

モデル特徴

高速推論

CTranslate2とint8量子化により2～8倍の推論速度向上を実現

多言語対応

複数のロマンス語派の言語から英語への翻訳をサポート

量子化最適化

int8量子化バージョンを提供し、精度を維持しながら計算リソースの必要量を削減

モデル能力

テキスト翻訳

多言語処理

使用事例

言語翻訳

ロマンス語派から英語への翻訳

フランス語、スペイン語、イタリア語などのロマンス語派の言語を英語に翻訳

Tatoebaテストセットで62.2 BLEUと0.750 chr - Fのスコアを達成

🚀 Ctranslate2を用いた高速推論

C++でのint8推論を使用することで、推論速度を2倍から8倍に向上させます。

Helsinki-NLP/opus-mt-ROMANCE-enの量子化バージョンです。

🚀 クイックスタート

このモデルを使用するには、必要なライブラリをインストールする必要があります。以下のコマンドを実行してください。

pip install hf-hub-ctranslate2>=1.0.0 ctranslate2>=3.13.0

変換には以下のコマンドを使用しました。

ct2-transformers-converter --model Helsinki-NLP/opus-mt-ROMANCE-en --output_dir /home/michael/tmp-ct2fast-opus-mt-ROMANCE-en --force --copy_files README.md generation_config.json tokenizer_config.json vocab.json source.spm .gitattributes target.spm --quantization float16

このチェックポイントは、ctranslate2 と hf-hub-ctranslate2 と互換性があります。

device="cuda" の場合は compute_type=int8_float16
device="cpu" の場合は compute_type=int8

💻 使用例

基本的な使用法

from hf_hub_ctranslate2 import TranslatorCT2fromHfHub, GeneratorCT2fromHfHub
from transformers import AutoTokenizer

model_name = "michaelfeil/ct2fast-opus-mt-ROMANCE-en"
# モデルに応じて、TranslatorCT2fromHfHub または GeneratorCT2fromHfHub を使用します。
model = TranslatorCT2fromHfHub(
        # CUDA上でint8で読み込む
        model_name_or_path=model_name, 
        device="cuda",
        compute_type="int8_float16",
        tokenizer=AutoTokenizer.from_pretrained("Helsinki-NLP/opus-mt-ROMANCE-en")
)
outputs = model.generate(
    text=["How do you call a fast Flan-ingo?", "User: How are you doing?"],
)
print(outputs)

📄 ライセンス

これは単なる量子化バージョンです。ライセンス条件は、元のHugging Faceリポジトリと同じであることを意図しています。

📚 ドキュメント

opus-mt-ROMANCE-en

ソース言語: fr,fr_BE,fr_CA,fr_FR,wa,frp,oc,ca,rm,lld,fur,lij,lmo,es,es_AR,es_CL,es_CO,es_CR,es_DO,es_EC,es_ES,es_GT,es_HN,es_MX,es_NI,es_PA,es_PE,es_PR,es_SV,es_UY,es_VE,pt,pt_br,pt_BR,pt_PT,gl,lad,an,mwl,it,it_IT,co,nap,scn,vec,sc,ro,la
ターゲット言語: en
OPUSのREADME: fr+fr_BE+fr_CA+fr_FR+wa+frp+oc+ca+rm+lld+fur+lij+lmo+es+es_AR+es_CL+es_CO+es_CR+es_DO+es_EC+es_ES+es_GT+es_HN+es_MX+es_NI+es_PA+es_PE+es_PR+es_SV+es_UY+es_VE+pt+pt_br+pt_BR+pt_PT+gl+lad+an+mwl+it+it_IT+co+nap+scn+vec+sc+ro+la-en
データセット: opus
モデル: transformer
前処理: 正規化 + SentencePiece
元の重みのダウンロード: opus-2020-04-01.zip
テストセットの翻訳: opus-2020-04-01.test.txt
テストセットのスコア: opus-2020-04-01.eval.txt