🚀 EnViT5翻譯模型
EnViT5是先進的英越和越英翻譯模型,在MTet和PhoMT數據集上進行訓練,能夠提供高質量的翻譯服務。
🚀 快速開始
安裝依賴
確保你已經安裝了transformers
庫,可以使用以下命令進行安裝:
pip install transformers
代碼示例
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
model_name = "ngtoanrob/vien-translation"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
inputs = [
"vi: VietAI là tổ chức phi lợi nhuận với sứ mệnh ươm mầm tài năng về trí tuệ nhân tạo và xây dựng một cộng đồng các chuyên gia trong lĩnh vực trí tuệ nhân tạo đẳng cấp quốc tế tại Việt Nam.",
"vi: Theo báo cáo mới nhất của Linkedin về danh sách việc làm triển vọng với mức lương hấp dẫn năm 2020, các chức danh công việc liên quan đến AI như Chuyên gia AI (Artificial Intelligence Specialist), Kỹ sư ML (Machine Learning Engineer) đều xếp thứ hạng cao.",
"en: Our teams aspire to make discoveries that impact everyone, and core to our approach is sharing our research and tools to fuel progress in the field.",
"en: We're on a journey to advance and democratize artificial intelligence through open source and open science."
]
outputs = model.generate(tokenizer(inputs, return_tensors="pt", padding=True).input_ids.to('cuda'), max_length=512)
print(tokenizer.batch_decode(outputs, skip_special_tokens=True))
✨ 主要特性
- 先進模型:基於最新的技術架構,在英越和越英翻譯任務上達到了先進水平。
- 多數據集訓練:在MTet和PhoMT等多個數據集上進行訓練,具有更強的泛化能力。
📦 模型信息
屬性 |
詳情 |
支持語言 |
越南語、英語 |
訓練數據集 |
ngtoanrob/vi-en-v1-dataset |
標籤 |
翻譯 |
許可證 |
openrail |
評估指標 |
bleu |
📚 詳細文檔
結果展示

引用信息
如果你在研究中使用了該模型,請使用以下 BibTeX 引用:
@misc{https://doi.org/10.48550/arxiv.2210.05610,
doi = {10.48550/ARXIV.2210.05610},
author = {Ngo, Chinh and Trinh, Trieu H. and Phan, Long and Tran, Hieu and Dang, Tai and Nguyen, Hieu and Nguyen, Minh and Luong, Minh-Thang},
title = {MTet: Multi-domain Translation for English and Vietnamese},
publisher = {arXiv},
year = {2022},
}
📄 許可證
本項目採用openrail
許可證。