wmt21-dense-24-wide-x-en Open-source Translation Model - Supports Multilingual Translation from 7 Languages to English

Wmt21 Dense 24 Wide X En

Developed by facebook

A 4.7 billion parameter multilingual encoder-decoder model supporting translation from 7 languages to English

Supports Multiple LanguagesOpen Source License:MIT #Multilingual translation #4.7 billion parameters #News domain optimization

Downloads 17

Release Time : 3/2/2022

Model Overview

A sequence-to-sequence model specifically trained for one-to-many multilingual translation tasks, capable of translating Hausa, Icelandic, Japanese, Czech, Russian, Chinese, and German into English

Model Features

Multilingual support

Supports high-quality translation from 7 different languages to English

Large-scale parameters

Powerful model architecture with 4.7 billion parameters for more accurate translation results

Domain adaptability

Supports text translation in news and other domains, distinguished by prefix tags

Model Capabilities

Multilingual text translation

News domain text processing

Cross-language information conversion

Use Cases

Language services

News translation

Quickly translate non-English news content into English

High-quality translation preserving original semantics

Cross-language communication

Help users understand text content in different languages

Instant conversion from 7 languages to English

Education research

Language learning assistance

Provide reference translations for language learners

Accurate multilingual comparative learning materials

🚀 WMT 21 X-En

WMT 21 X-En is a 4.7B multilingual encoder-decoder (seq-to-seq) model designed for one-to-many multilingual translation, enabling direct text translation from 7 languages to English.

🚀 Quick Start

WMT 21 X-En is a 4.7B multilingual encoder-decoder (seq-to-seq) model trained for one-to-many multilingual translation. It was introduced in this paper and first released in this repository.

The model can directly translate text from 7 languages: Hausa (ha), Icelandic (is), Japanese (ja), Czech (cs), Russian (ru), Chinese (zh), German (de) to English.

To translate into a target language, the target language id is forced as the first generated token. To force the target language id as the first generated token, pass the forced_bos_token_id parameter to the generate method.

⚠️ Important Note

M2M100Tokenizer depends on sentencepiece, so make sure to install it before running the example. To install sentencepiece run pip install sentencepiece

Since the model was trained with domain tags, you should prepend them to the input as well.

"wmtdata newsdomain": Use for sentences in the news domain
"wmtdata otherdomain": Use for sentences in all other domain

💻 Usage Examples

Basic Usage

from transformers import AutoModelForSeq2SeqLM, AutoTokenizer

model = AutoModelForSeq2SeqLM.from_pretrained("facebook/wmt21-dense-24-wide-x-en")
tokenizer = AutoTokenizer.from_pretrained("facebook/wmt21-dense-24-wide-x-en")

# translate German to English
tokenizer.src_lang = "de"
inputs = tokenizer("wmtdata newsdomain Ein Modell für viele Sprachen", return_tensors="pt")
generated_tokens = model.generate(**inputs)
tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
# => "A model for many languages"

# translate Icelandic to English
tokenizer.src_lang = "is"
inputs = tokenizer("wmtdata newsdomain Ein fyrirmynd fyrir mörg tungumál", return_tensors="pt")
generated_tokens = model.generate(**inputs)
tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
# => "One model for many languages"

Advanced Usage

To translate into a target language, you need to force the target language id as the first generated token. You can achieve this by passing the forced_bos_token_id parameter to the generate method.

# Example of using forced_bos_token_id (pseudo - code, adjust according to actual situation)
target_language_id = tokenizer.get_lang_id("en")
generated_tokens = model.generate(**inputs, forced_bos_token_id=target_language_id)

📚 Documentation

See the model hub to look for more fine-tuned versions.

📄 License

This project is licensed under the MIT license.

Languages covered

Property	Details
Languages Covered	English (en), Hausa (ha), Icelandic (is), Japanese (ja), Czech (cs), Russian (ru), Chinese (zh), German (de)

BibTeX entry and citation info

@inproceedings{tran2021facebook
  title={Facebook AI’s WMT21 News Translation Task Submission},
  author={Chau Tran and Shruti Bhosale and James Cross and Philipp Koehn and Sergey Edunov and Angela Fan},
  booktitle={Proc. of WMT},
  year={2021},
}

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご