🚀 quickmt-zh-en
神經機器翻譯模型
quickmt-zh-en
是一個速度較快且準確性較高的神經機器翻譯模型,用於將中文(zh
)翻譯成英文(en
)。
🚀 快速開始
安裝與下載
首先,安裝 quickmt
並下載模型:
git clone https://github.com/quickmt/quickmt.git
pip install ./quickmt/
quickmt-model-download quickmt/quickmt-zh-en ./quickmt-zh-en
使用示例
from quickmt import Translator
t = Translator("./quickmt-zh-en/", device="auto")
t(["他補充道:“我們現在有 4 個月大沒有糖尿病的老鼠,但它們曾經得過該病。”"], beam_size=1)
t(["他補充道:“我們現在有 4 個月大沒有糖尿病的老鼠,但它們曾經得過該病。”"], sampling_temperature=1.2, beam_size=1, sampling_topk=50, sampling_topp=0.9)
✨ 主要特性
- 該模型使用
eole
進行訓練。
- 擁有 2 億參數的 Transformer “大” 模型,包含 8 個編碼器層和 2 個解碼器層。
- 採用獨立的源語言和目標語言 Sentencepiece 分詞器。
- 已導出為 CTranslate2 格式,以實現快速推理。
- 訓練數據:https://huggingface.co/datasets/quickmt/quickmt-train.zh-en/tree/main
更多詳細信息請查看本倉庫中的 eole
模型配置。
📦 安裝指南
要使用 quickmt-zh-en
模型,您需要安裝 quickmt
並下載該模型,具體命令如下:
git clone https://github.com/quickmt/quickmt.git
pip install ./quickmt/
quickmt-model-download quickmt/quickmt-zh-en ./quickmt-zh-en
💻 使用示例
基礎用法
from quickmt import Translator
t = Translator("./quickmt-zh-en/", device="auto")
t(["他補充道:“我們現在有 4 個月大沒有糖尿病的老鼠,但它們曾經得過該病。”"], beam_size=1)
高級用法
from quickmt import Translator
t = Translator("./quickmt-zh-en/", device="auto")
t(["他補充道:“我們現在有 4 個月大沒有糖尿病的老鼠,但它們曾經得過該病。”"], sampling_temperature=1.2, beam_size=1, sampling_topk=50, sampling_topp=0.9)
📚 詳細文檔
該模型以 ctranslate2
格式導出,分詞器為 sentencepiece
,因此您可以直接使用 ctranslate2
而不通過 quickmt
進行推理。此外,該模型也可以與使用 ctranslate2
和 sentencepiece
的 LibreTranslate 等工具配合使用。
🔧 技術細節
評估指標
使用 sacrebleu 在 Flores200 devtest
測試集 上計算 BLEU 和 CHRF2 指標(從 “zho_Hans” 到 “eng_Latn”)。使用 comet
庫和 默認模型 計算 COMET22 指標。“Time (s)” 表示在 RTX 4070s GPU 上以批量大小 32 翻譯 flores-devtest 數據集(1012 個句子)所需的時間(秒)。
模型 |
BLEU |
CHRF2 |
COMET22 |
時間 (s) |
quickmt/quickmt-zh-en |
29.36 |
58.10 |
0.8655 |
0.88 |
Helsinki-NLP/opus-mt-zh-en |
23.35 |
53.60 |
0.8426 |
3.78 |
facebook/m2m100_418M |
15.99 |
50.13 |
0.7881 |
16.61 |
facebook/nllb-200-distilled-600M |
26.22 |
55.18 |
0.8507 |
20.89 |
facebook/m2m100_1.2B |
20.30 |
54.23 |
0.8206 |
33.12 |
facebook/nllb-200-distilled-1.3B |
28.56 |
57.35 |
0.8620 |
36.64 |
quickmt-zh-en
是速度最快且質量最高的模型。
📄 許可證
本模型採用 CC BY 4.0 許可證。
📦 數據集與模型信息
屬性 |
詳情 |
模型名稱 |
quickmt-zh-en |
訓練數據集 |
quickmt/quickmt-train.zh-en |
評估任務 |
中文到英文的翻譯(Translation zho-eng) |
評估數據集 |
flores101-devtest |
評估指標 |
BLEU、CHRF、COMET22 |