QuickMT-ZH-ENオープンソースニューラル機械翻訳モデル - 中国語から英語への迅速かつ正確な翻訳を実現

ホーム

Quickmt Zh En

quickmtによって開発

高速かつ高精度なニューラル機械翻訳モデルで、中国語から英語への翻訳に使用されます

機械翻訳複数言語対応#高速翻訳 #中英相互翻訳 #軽量モデル

ダウンロード数 23

リリース時間 : 2/1/2025

モデル概要

このモデルは200MパラメータのTransformer 'big'モデルで、中国語から英語への高速高品質翻訳のために設計されています

モデル特徴

高速推論

CTranslate2フォーマットで最適化され、GPUアクセラレーションをサポートし、翻訳速度が速い

高品質翻訳

Flores200テストセットで29.36 BLEUスコアを達成し、同類モデルを上回る

柔軟なサンプリング

温度サンプリングを通じて代替翻訳結果を取得可能

モデル能力

中国語から英語への翻訳

バッチテキスト翻訳

代替翻訳生成

使用事例

テキスト翻訳

ドキュメント翻訳

中国語ドキュメントを英語に迅速に翻訳

原文の意味を保持した高品質な翻訳

コンテンツローカライゼーション

中国語コンテンツを英語版にローカライズ

自然で流暢なターゲット言語表現

🚀 `quickmt-zh-en` ニューラル機械翻訳モデル

quickmt-zh-en は、zh から en への翻訳に適した、適度な速度と精度を兼ね備えたニューラル機械翻訳モデルです。

✨ 主な機能

このモデルは、中国語から英語への翻訳に特化しており、適度な速度と精度を提供します。
トレーニングには、eole を使用しています。
200M パラメータのトランスフォーマー 'big' モデルで、エンコーダーが 8 層、デコーダーが 2 層で構成されています。
ソースとターゲットにそれぞれ独立した Sentencepiece トークナイザーを使用しています。
高速推論用に CTranslate2 形式にエクスポートされています。
トレーニングデータは、https://huggingface.co/datasets/quickmt/quickmt-train.zh-en/tree/main から入手できます。

📦 インストール

まず、quickmt をインストールし、モデルをダウンロードします。

git clone https://github.com/quickmt/quickmt.git
pip install ./quickmt/

quickmt-model-download quickmt/quickmt-zh-en ./quickmt-zh-en

💻 使用例

基本的な使用法

from quickmt import Translator

# 自動でGPUを検出します。CPU推論を強制する場合は "cpu" を設定します
t = Translator("./quickmt-zh-en/", device="auto")

# 翻訳 - より高品質（ただし低速）な翻訳を得るには、ビームサイズを 5 に設定します
t(["他补充道：“我们现在有 4 个月大没有糖尿病的老鼠，但它们曾经得过该病。”"], beam_size=1)

# サンプリングによって代替の翻訳を取得します
# cTranslate2 の `translate_batch` 引数を渡すことができます
t(["他补充道：“我们现在有 4 个月大没有糖尿病的老鼠，但它们曾经得过该病。”"], sampling_temperature=1.2, beam_size=1, sampling_topk=50, sampling_topp=0.9)

このモデルは ctranslate2 形式であり、トークナイザーは sentencepiece です。したがって、quickmt を介さずに ctranslate2 を直接使用することもできます。また、ctranslate2 と sentencepiece を使用する LibreTranslate などの他のツールでもこのモデルを使用できます。

📚 ドキュメント

メトリクス

sacrebleu を使用して、Flores200 devtest テストセット（"zho_Hans"->"eng_Latn"）で BLEU と CHRF2 を計算しています。COMET22 は、comet ライブラリとデフォルトモデルを使用して計算しています。"Time (s)" は、RTX 4070s GPU でバッチサイズ 32 で flores-devtest データセット（1012 文）を翻訳するのにかかる時間（秒）です。

モデル	bleu	chrf2	comet22	Time (s)
quickmt/quickmt-zh-en	29.36	58.10	0.8655	0.88
Helsinki-NLP/opus-mt-zh-en	23.35	53.60	0.8426	3.78
facebook/m2m100_418M	15.99	50.13	0.7881	16.61
facebook/nllb-200-distilled-600M	26.22	55.18	0.8507	20.89
facebook/m2m100_1.2B	20.30	54.23	0.8206	33.12
facebook/nllb-200-distilled-1.3B	28.56	57.35	0.8620	36.64