🚀 摩洛哥达尔吉亚语到英语翻译模型(微调版mBART)
本模型是mBART模型的微调版本,专门为摩洛哥达尔吉亚语到英语的翻译任务而设计。它基于Facebook的mBART,这是一个能够处理多种语言对的多语言模型。该微调模型在摩洛哥达尔吉亚语数据集上进行了训练,能够准确地将达尔吉亚语翻译成英语。
🚀 快速开始
你可以使用Hugging Face的transformers
库轻松加载模型和分词器。以下是一个示例:
from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
model_name = 'echarif/mBART_for_darija_transaltion'
model = MBartForConditionalGeneration.from_pretrained(model_name)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
input_text = "insert your Moroccan Darija sentence here"
inputs = tokenizer(input_text, return_tensors="pt", padding=True)
translated_tokens = model.generate(**inputs)
translated_text = tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
print(f"Translated Text: {translated_text}")
✨ 主要特性
- 基于微调版mBART模型,专为摩洛哥达尔吉亚语到英语的翻译任务设计。
- 能够准确翻译摩洛哥达尔吉亚语的对话和非正式文本。
📦 安装指南
文档未提及安装步骤,暂无法提供。
💻 使用示例
基础用法
from transformers import MBartForConditionalGeneration, MBart50TokenizerFast
model_name = 'echarif/mBART_for_darija_transaltion'
model = MBartForConditionalGeneration.from_pretrained(model_name)
tokenizer = MBart50TokenizerFast.from_pretrained(model_name)
input_text = "insert your Moroccan Darija sentence here"
inputs = tokenizer(input_text, return_tensors="pt", padding=True)
translated_tokens = model.generate(**inputs)
translated_text = tokenizer.decode(translated_tokens[0], skip_special_tokens=True)
print(f"Translated Text: {translated_text}")
高级用法
文档未提及高级用法代码示例,暂无法提供。
📚 详细文档
模型概述
属性 |
详情 |
模型类型 |
mBART(多语言BART) |
语言对 |
摩洛哥达尔吉亚语 → 英语 |
任务 |
机器翻译 |
训练数据集 |
该模型在包含摩洛哥达尔吉亚语到英语翻译对的自定义数据集上进行了微调。 |
模型细节
mBART模型是一个基于Transformer的序列到序列模型,旨在处理多种语言。它特别适用于翻译、文本生成和摘要等任务。
针对此特定任务,该模型已进行微调,能够准确地将摩洛哥达尔吉亚语文本翻译成英语,适用于涉及摩洛哥对话和非正式文本翻译的应用程序。
预期用途
该模型可用于:
🔧 技术细节
mBART模型是一个基于Transformer的序列到序列模型,设计用于处理多种语言。它在翻译、文本生成和摘要等任务中表现出色。对于这个特定的任务,模型在自定义的摩洛哥达尔吉亚语到英语的翻译数据集上进行了微调,以提高从摩洛哥达尔吉亚语到英语的翻译准确性。
📄 许可证
本模型采用Apache-2.0许可证。