mt5_base_eng_yor_mt开源翻译模型 - 免费实现英语到约鲁巴语高效翻译

首页

Mt5 Base Eng Yor Mt

由 Davlan 开发

基于mT5-base微调的英语到约鲁巴语机器翻译模型，在JW300和Menyo-20k数据集上训练

机器翻译

Transformers

#英译约鲁巴语 #多语言机器翻译 #mT5微调

下载量 138

发布时间 : 3/2/2022

模型简介

该模型是一个机器翻译模型，专门用于将英语文本翻译成约鲁巴语，为英译约鲁巴语任务建立了强基准。

模型特点

强基准模型

为英译约鲁巴语任务建立了强基准性能

多数据集训练

结合JW300语料库和Menyo-20k数据集进行训练

基于mT5架构

利用强大的mT5-base模型进行微调

模型能力

英语到约鲁巴语的文本翻译

使用案例

语言翻译

日常用语翻译

将英语日常用语翻译成约鲁巴语

在Menyo-20k测试集上获得9.82 BLEU分

🚀 mT5_base_eng_yor_mt

mT5_base_eng_yor_mt是一个基于微调mT5-base模型的机器翻译模型，可实现从英语到约鲁巴语的自动翻译，为该翻译任务建立了强大的基线。

🚀 快速开始

你可以使用Transformers库的pipeline来使用这个模型进行机器翻译。以下是使用示例：

from transformers import MT5ForConditionalGeneration, T5Tokenizer

model = MT5ForConditionalGeneration.from_pretrained("Davlan/mt5_base_eng_yor_mt")
tokenizer = T5Tokenizer.from_pretrained("google/mt5-base")
input_string = "Where are you?"
inputs = tokenizer.encode(input_string, return_tensors="pt")
generated_tokens = model.generate(inputs)
results = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(results)

✨ 主要特性

基于微调的mT5-base模型，为英语到约鲁巴语的翻译建立了强大基线。
可使用Transformers库的pipeline方便地进行调用。

📦 安装指南

文档未提供具体安装步骤，故跳过该章节。

💻 使用示例

基础用法

from transformers import MT5ForConditionalGeneration, T5Tokenizer

model = MT5ForConditionalGeneration.from_pretrained("Davlan/mt5_base_eng_yor_mt")
tokenizer = T5Tokenizer.from_pretrained("google/mt5-base")
input_string = "Where are you?"
inputs = tokenizer.encode(input_string, return_tensors="pt")
generated_tokens = model.generate(inputs)
results = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
print(results)