🚀 EnViT5翻译模型
EnViT5是先进的英越和越英翻译模型,在MTet和PhoMT数据集上进行训练,能够提供高质量的翻译服务。
🚀 快速开始
安装依赖
确保你已经安装了transformers
库,可以使用以下命令进行安装:
pip install transformers
代码示例
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
model_name = "ngtoanrob/vien-translation"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
inputs = [
"vi: VietAI là tổ chức phi lợi nhuận với sứ mệnh ươm mầm tài năng về trí tuệ nhân tạo và xây dựng một cộng đồng các chuyên gia trong lĩnh vực trí tuệ nhân tạo đẳng cấp quốc tế tại Việt Nam.",
"vi: Theo báo cáo mới nhất của Linkedin về danh sách việc làm triển vọng với mức lương hấp dẫn năm 2020, các chức danh công việc liên quan đến AI như Chuyên gia AI (Artificial Intelligence Specialist), Kỹ sư ML (Machine Learning Engineer) đều xếp thứ hạng cao.",
"en: Our teams aspire to make discoveries that impact everyone, and core to our approach is sharing our research and tools to fuel progress in the field.",
"en: We're on a journey to advance and democratize artificial intelligence through open source and open science."
]
outputs = model.generate(tokenizer(inputs, return_tensors="pt", padding=True).input_ids.to('cuda'), max_length=512)
print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
✨ 主要特性
- 先进模型:基于最新的技术架构,在英越和越英翻译任务上达到了先进水平。
- 多数据集训练:在MTet和PhoMT等多个数据集上进行训练,具有更强的泛化能力。
📦 模型信息
属性 |
详情 |
支持语言 |
越南语、英语 |
训练数据集 |
ngtoanrob/vi-en-v1-dataset |
标签 |
翻译 |
许可证 |
openrail |
评估指标 |
bleu |
📚 详细文档
结果展示

引用信息
如果你在研究中使用了该模型,请使用以下 BibTeX 引用:
@misc{https://doi.org/10.48550/arxiv.2210.05610,
doi = {10.48550/ARXIV.2210.05610},
author = {Ngo, Chinh and Trinh, Trieu H. and Phan, Long and Tran, Hieu and Dang, Tai and Nguyen, Hieu and Nguyen, Minh and Luong, Minh-Thang},
title = {MTet: Multi-domain Translation for English and Vietnamese},
publisher = {arXiv},
year = {2022},
}
📄 许可证
本项目采用openrail
许可证。