nllb-200-distilled-350M_en-ko開源翻譯模型 - 輕量級英語到韓語免費翻譯，CPU能運行

首頁

Nllb 200 Distilled 350M En Ko

由dhtocks開發

這是一個輕量級的英語到韓語翻譯模型，基於NLLB-200 600M模型優化而來，參數僅為350M，可在CPU上運行。

機器翻譯

Transformers

支持多種語言#輕量級翻譯 #英韓互譯 #CPU友好

下載量 103

發布時間 : 4/25/2024

模型概述

該模型專注於英語到韓語的翻譯任務，通過減少層數降低了計算資源需求，適合資源有限的用戶使用。

模型特點

輕量級模型

參數僅為350M，相比原NLLB-200 600M模型更輕量，降低了計算資源需求。

可CPU運行

無需混合精度和量化，可在CPU上運行，適合資源有限的用戶。

高效推理

在CPU上的推理時間為1.43秒，GPU上為0.24秒，適合即時翻譯需求。

模型能力

英語到韓語翻譯

低資源環境運行

使用案例

翻譯應用

即時文本翻譯

將英語文本即時翻譯為韓語，適用於聊天、郵件等場景。

翻譯質量達到chrF(++) 24.6

低資源環境翻譯

在計算資源有限的設備上運行翻譯任務，如移動設備或邊緣計算設備。

可在CPU上高效運行

🚀 NLLB-200 Distilled-350M_en2ko

NLLB-200模型在翻譯任務中表現出色，為解決低資源語言問題做出了貢獻。然而，對於計算資源有限的用戶來說，運行6億參數及以上的模型仍具有挑戰性。因此，我創建了一個更小的模型，專注於英語到韓語的翻譯，該模型甚至可以在CPU上運行（無需混合精度和量化）。

🚀 快速開始

你可以按照以下代碼示例快速使用該模型進行英語到韓語的翻譯：

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

model = AutoModelForSeq2SeqLM.from_pretrained('dhtocks/nllb-200-distilled-350M_en-ko', forced_bos_token_id=256098)
tokenizer = AutoTokenizer.from_pretrained('dhtocks/nllb-200-distilled-350M_en-ko', src_lang='eng_Latn', tgt_lang='kor_Hang')

inputs = tokenizer('[YOUR_INPUT]', return_tensors="pt")
output = model.generate(**inputs)
print(tokenizer.decode(output[0]))

✨ 主要特性

輕量級模型：基於NLLB-200 6億參數模型進行優化，參數僅為3.50537728億（350M），降低了計算資源需求。
可CPU運行：無需混合精度和量化，可在CPU上運行，方便資源有限的用戶使用。

📦 安裝指南

文檔未提供具體安裝步驟，可參考transformers庫的官方安裝指南進行安裝。

💻 使用示例

基礎用法

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

model = AutoModelForSeq2SeqLM.from_pretrained('dhtocks/nllb-200-distilled-350M_en-ko', forced_bos_token_id=256098)
tokenizer = AutoTokenizer.from_pretrained('dhtocks/nllb-200-distilled-350M_en-ko', src_lang='eng_Latn', tgt_lang='kor_Hang')

inputs = tokenizer('[YOUR_INPUT]', return_tensors="pt")
output = model.generate(**inputs)
print(tokenizer.decode(output[0]))

📚 詳細文檔

模型信息

屬性	詳情
模型類型	基於NLLB-200 600M
參數數量	350,537,728 (350M)
編碼器層數	從12層減少到3層
解碼器層數	從12層減少到3層
FFN維度	4096（保持不變）
嵌入維度	1024（保持不變）
詞表大小	256206（保持不變）
許可證	CC-BY-NC

數據信息

屬性	詳情
訓練數據	NLLB數據集
評估數據	Flores-200數據集

評估指標

模型	參數數量	chrF(++)	GPU推理時間 (s)	CPU推理時間 (s)
NLLB-200 3.3B	3.3B	34.3	0.98 s	4.65 s
NLLB-200 1.3B	1.3B	32.1	0.89 s	2.46 s
NLLB-200 600M	600M	32	0.43 s	1.52 s
NLLB-200 350M (ours)	350M	24.6	0.24 s	1.43 s

硬件環境

CPU：Intel (R) Xeon(R) CPU @ 2.20GHz (16 cores)
GPU：NVIDIA L4 24GB

📄 許可證

本模型使用的許可證為CC-BY-NC 4.0。

📚 引用信息

@misc{,
  title={NLLB-200 distilled_350M_en-ko},
  author={Saechan Oh},
  year={2024}
}

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫