🚀 摩洛哥達爾吉亞語到英語翻譯模型(微調版mBART)
本模型是mBART模型的微調版本,專門為摩洛哥達爾吉亞語到英語的翻譯任務而設計。它基於Facebook的mBART,這是一個能夠處理多種語言對的多語言模型。該微調模型在摩洛哥達爾吉亞語數據集上進行了訓練,能夠準確地將達爾吉亞語翻譯成英語。
🚀 快速開始
你可以使用Hugging Face的transformers
庫輕鬆加載模型和分詞器。以下是一個示例:
from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
model_name = 'echarif/mBART_for_darija_transaltion'
model = MBartForConditionalGeneration.from_pretrained(model_name)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
input_text = "insert your Moroccan Darija sentence here"
inputs = tokenizer(input_text, return_tensors="pt", padding=True)
translated_tokens = model.generate(**inputs)
translated_text = tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
print(f"Translated Text: {translated_text}")
✨ 主要特性
- 基於微調版mBART模型,專為摩洛哥達爾吉亞語到英語的翻譯任務設計。
- 能夠準確翻譯摩洛哥達爾吉亞語的對話和非正式文本。
📦 安裝指南
文檔未提及安裝步驟,暫無法提供。
💻 使用示例
基礎用法
from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
model_name = 'echarif/mBART_for_darija_transaltion'
model = MBartForConditionalGeneration.from_pretrained(model_name)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
input_text = "insert your Moroccan Darija sentence here"
inputs = tokenizer(input_text, return_tensors="pt", padding=True)
translated_tokens = model.generate(**inputs)
translated_text = tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
print(f"Translated Text: {translated_text}")
高級用法
文檔未提及高級用法代碼示例,暫無法提供。
📚 詳細文檔
模型概述
屬性 |
詳情 |
模型類型 |
mBART(多語言BART) |
語言對 |
摩洛哥達爾吉亞語 → 英語 |
任務 |
機器翻譯 |
訓練數據集 |
該模型在包含摩洛哥達爾吉亞語到英語翻譯對的自定義數據集上進行了微調。 |
模型細節
mBART模型是一個基於Transformer的序列到序列模型,旨在處理多種語言。它特別適用於翻譯、文本生成和摘要等任務。
針對此特定任務,該模型已進行微調,能夠準確地將摩洛哥達爾吉亞語文本翻譯成英語,適用於涉及摩洛哥對話和非正式文本翻譯的應用程序。
預期用途
該模型可用於:
🔧 技術細節
mBART模型是一個基於Transformer的序列到序列模型,設計用於處理多種語言。它在翻譯、文本生成和摘要等任務中表現出色。對於這個特定的任務,模型在自定義的摩洛哥達爾吉亞語到英語的翻譯數據集上進行了微調,以提高從摩洛哥達爾吉亞語到英語的翻譯準確性。
📄 許可證
本模型採用Apache-2.0許可證。