🚀 英语到库尔德语翻译
本仓库提供了预训练的多语言翻译模型,旨在实现多种语言之间快速且准确的翻译,支持的语言包括库尔德语、萨摩亚语、科萨语、老挝语、科西嘉语、宿务语、加利西亚语、意第绪语、斯瓦希里语和约鲁巴语等。这些模型可用于将这些语言的文本与英语进行互译,适用于机器翻译任务、语言本地化项目以及构建自定义翻译工具。
🚀 快速开始
本项目提供的预训练多语言翻译模型能助力你轻松完成多种语言与英语的互译工作。
✨ 主要特性
- 支持英语到库尔德语的翻译。
- 支持多种语言(完整列表见下文)。
- 经过预训练并针对准确性进行了优化。
- 易于集成到现有的翻译工作流程中。
📦 安装指南
要运行这些模型,你需要安装 ctranslate2
和 sentencepiece
:
pip install ctranslate2 sentencepiece
💻 使用示例
基础用法
以下代码展示了如何加载并使用一个模型进行从英语到库尔德语(en → ku
)的翻译:
import sentencepiece as spm
from ctranslate2 import Translator
path_to_model = <here_is_your_path_to_the_model>
source = 'en'
target = 'ku'
translator = Translator(path_to_model, compute_type='int8')
source_tokenizer = spm.SentencePieceProcessor(f'{path_to_model}/{source}.spm.model')
target_tokenizer = spm.SentencePieceProcessor(f'{path_to_model}/{target}.spm.model')
text = [
'I need to make a phone call.',
'Can I help you prepare food?',
'We want to go for a walk.'
]
input_tokens = source_tokenizer.EncodeAsPieces(text)
translator_output = translator.translate_batch(
input_tokens,
batch_type='tokens',
beam_size=2,
max_input_length=0,
max_decoding_length=256
)
output_tokens = [item.hypotheses[0] for item in translator_output]
translation = target_tokenizer.DecodePieces(output_tokens)
print('\n'.join(translation))
📚 详细文档
支持的其他语言
- 库尔德语
- 萨摩亚语
- 科萨语
- 老挝语
- 科西嘉语
- 宿务语
- 加利西亚语
- 意第绪语
- 斯瓦希里语
- 约鲁巴语
使用场景
- 对使用人数较少的语言的文本进行机器翻译。
- 将网站、应用程序或文档本地化到多种语言。
- 为研究和生产环境开发多语言自然语言处理工具。
关键词
库尔德语到英语翻译、萨摩亚语到英语翻译、科萨语翻译、老挝语到英语翻译、科西嘉语翻译、宿务语翻译、加利西亚语到英语翻译、意第绪语到英语翻译、斯瓦希里语翻译、约鲁巴语到英语翻译、多语言机器翻译、自然语言处理、神经网络、在线学习
联系我们
如果您有任何问题,请发送电子邮件至 info@lingvanex.com。
📄 许可证
本项目采用 MIT 许可证。