mbart-ja-en Open-Source Japanese-to-English Translation Model - Achieve Accurate Japanese-English Translation for Free

Mbart Ja En

Developed by ken11

Japanese-to-English translation model fine-tuned on facebook/mbart-large-cc25

Supports Multiple LanguagesOpen Source License:MIT #Japanese-English Translation #Fine-tuned on JESC #SentencePiece Tokenization

Downloads 75

Release Time : 3/2/2022

Model Overview

This model is a Japanese-to-English translation model based on the MBART architecture, fine-tuned using the JESC dataset, suitable for Japanese-to-English text translation tasks.

Model Features

Based on MBART Architecture

Uses facebook/mbart-large-cc25 as the base model, featuring robust multilingual processing capabilities.

Fine-tuned on JESC Dataset

Fine-tuned using the large-scale Japanese-English parallel corpus JESC to improve translation quality.

Dedicated Tokenizer

Uses a SentencePiece tokenizer trained on the JESC dataset, optimized for processing Japanese and English.

Model Capabilities

Japanese-to-English Text Translation

Use Cases

Text Translation

Daily Phrase Translation

Translates Japanese daily phrases into English

Example input '今日もご安全に' can be translated into English

Professional Document Translation

Translates Japanese professional documents into English

🚀 mbart-ja-en

This model is based on facebook/mbart-large-cc25 and fine - tuned on the JESC dataset, aiming to provide high - quality Japanese - English translation.

🚀 Quick Start

This section shows you how to quickly start using the mbart - ja - en model for Japanese - English translation.

from transformers import (
    MBartForConditionalGeneration, MBartTokenizer
)

tokenizer = MBartTokenizer.from_pretrained("ken11/mbart-ja-en")
model = MBartForConditionalGeneration.from_pretrained("ken11/mbart-ja-en")

inputs = tokenizer("こんにちは", return_tensors="pt")
translated_tokens = model.generate(**inputs, decoder_start_token_id=tokenizer.lang_code_to_id["en_XX"], early_stopping=True, max_length=48)
pred = tokenizer.batch_decode(translated_tokens, skip_special_tokens=True)[0]
print(pred)

✨ Features

Based on a large - scale model: Built on [facebook/mbart - large - cc25](https://huggingface.co/facebook/mbart - large - cc25), leveraging the pre - trained knowledge of the large - scale model.
Fine - tuned on specific data: Fine - tuned on the JESC dataset, which can better adapt to Japanese - English translation tasks.

📦 Installation

The installation of this model mainly involves installing the transformers library. You can use the following command to install it:

pip install transformers

💻 Usage Examples

Basic Usage

from transformers import (
    MBartForConditionalGeneration, MBartTokenizer
)

tokenizer = MBartTokenizer.from_pretrained("ken11/mbart-ja-en")
model = MBartForConditionalGeneration.from_pretrained("ken11/mbart-ja-en")

inputs = tokenizer("こんにちは", return_tensors="pt")
translated_tokens = model.generate(**inputs, decoder_start_token_id=tokenizer.lang_code_to_id["en_XX"], early_stopping=True, max_length=48)
pred = tokenizer.batch_decode(translated_tokens, skip_special_tokens=True)[0]
print(pred)

Advanced Usage

# Advanced scenarios can adjust parameters such as max_length and early_stopping according to actual needs
from transformers import (
    MBartForConditionalGeneration, MBartTokenizer
)

tokenizer = MBartTokenizer.from_pretrained("ken11/mbart-ja-en")
model = MBartForConditionalGeneration.from_pretrained("ken11/mbart-ja-en")

text = "この文章はより長い文章です。"
inputs = tokenizer(text, return_tensors="pt")
translated_tokens = model.generate(**inputs, decoder_start_token_id=tokenizer.lang_code_to_id["en_XX"], early_stopping=True, max_length=128)
pred = tokenizer.batch_decode(translated_tokens, skip_special_tokens=True)[0]
print(pred)

📚 Documentation

Training Data

I used the JESC dataset for training.
Thank you for publishing such a large dataset.

Tokenizer

The tokenizer uses the sentencepiece trained on the JESC dataset.

Note

The result of evaluating the sacrebleu score for [JEC Basic Sentence Data of Kyoto University](https://nlp.ist.i.kyoto - u.ac.jp/EN/?JEC+Basic+Sentence+Data#i0163896) was 18.18.

📄 License

This project is licensed under The MIT license.

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご