🚀 英語到庫爾德語翻譯
本倉庫提供了預訓練的多語言翻譯模型,旨在實現多種語言之間快速且準確的翻譯,支持的語言包括庫爾德語、薩摩亞語、科薩語、老撾語、科西嘉語、宿務語、加利西亞語、意第緒語、斯瓦希里語和約魯巴語等。這些模型可用於將這些語言的文本與英語進行互譯,適用於機器翻譯任務、語言本地化項目以及構建自定義翻譯工具。
🚀 快速開始
本項目提供的預訓練多語言翻譯模型能助力你輕鬆完成多種語言與英語的互譯工作。
✨ 主要特性
- 支持英語到庫爾德語的翻譯。
- 支持多種語言(完整列表見下文)。
- 經過預訓練並針對準確性進行了優化。
- 易於集成到現有的翻譯工作流程中。
📦 安裝指南
要運行這些模型,你需要安裝 ctranslate2
和 sentencepiece
:
pip install ctranslate2 sentencepiece
💻 使用示例
基礎用法
以下代碼展示瞭如何加載並使用一個模型進行從英語到庫爾德語(en → ku
)的翻譯:
import sentencepiece as spm
from ctranslate2 import Translator
path_to_model = <here_is_your_path_to_the_model>
source = 'en'
target = 'ku'
translator = Translator(path_to_model, compute_type='int8')
source_tokenizer = spm.SentencePieceProcessor(f'{path_to_model}/{source}.spm.model')
target_tokenizer = spm.SentencePieceProcessor(f'{path_to_model}/{target}.spm.model')
text = [
'I need to make a phone call.',
'Can I help you prepare food?',
'We want to go for a walk.'
]
input_tokens = source_tokenizer.EncodeAsPieces(text)
translator_output = translator.translate_batch(
input_tokens,
batch_type='tokens',
beam_size=2,
max_input_length=0,
max_decoding_length=256
)
output_tokens = [item.hypotheses[0] for item in translator_output]
translation = target_tokenizer.DecodePieces(output_tokens)
print('\n'.join(translation))
📚 詳細文檔
支持的其他語言
- 庫爾德語
- 薩摩亞語
- 科薩語
- 老撾語
- 科西嘉語
- 宿務語
- 加利西亞語
- 意第緒語
- 斯瓦希里語
- 約魯巴語
使用場景
- 對使用人數較少的語言的文本進行機器翻譯。
- 將網站、應用程序或文檔本地化到多種語言。
- 為研究和生產環境開發多語言自然語言處理工具。
關鍵詞
庫爾德語到英語翻譯、薩摩亞語到英語翻譯、科薩語翻譯、老撾語到英語翻譯、科西嘉語翻譯、宿務語翻譯、加利西亞語到英語翻譯、意第緒語到英語翻譯、斯瓦希里語翻譯、約魯巴語到英語翻譯、多語言機器翻譯、自然語言處理、神經網絡、在線學習
聯繫我們
如果您有任何問題,請發送電子郵件至 info@lingvanex.com。
📄 許可證
本項目採用 MIT 許可證。