Quadrifoglio-mt-en-itオープンソース翻訳モデル - 無料で高精度な英語からイタリア語への翻訳を実現

ホーム

Quadrifoglio Mt En It

puettmannによって開発

bigscience/mt0-smallアーキテクチャに基づくエンコーダ-デコーダトランスフォーマーモデルで、英語-イタリア語テキスト翻訳に特化

機械翻訳

Transformers

複数言語対応オープンソースライセンス:Apache-2.0 #英伊翻訳 #小型翻訳モデル #単文最適化

ダウンロード数 29

リリース時間 : 12/23/2024

モデル概要

このモデルは英語からイタリア語へのテキスト翻訳タスク専用で、Helsinki-NLP/opus-100とHelsinki-NLP/europarlの英伊対訳コーパスから訓練データを取得しています。

モデル特徴

英伊翻訳に特化

英語からイタリア語への翻訳タスクに特化して最適化

高品質コーパスベース

Helsinki-NLP/opus-100やeuroparlなどの高品質バイリンガルコーパスを使用して訓練

小型で効率的

mt0-smallアーキテクチャを基に、性能を維持しながらリソース消費を削減

モデル能力

英語からイタリア語へのテキスト翻訳

イタリア語から英語へのテキスト翻訳

使用事例

テキスト翻訳

日常会話翻訳

日常会話を英語からイタリア語に翻訳

'緑茶を一杯ください'などの日常表現を正確に翻訳

ビジネス文書翻訳

ビジネス文書内の文章を翻訳

専門用語の正確性を保持

🚀 クワドリフォリオ - 英語からイタリア語への翻訳用小型モデル

クワドリフォリオは、bigscience/mt0-smallをベースにした、英語とイタリア語のテキスト翻訳用のエンコーダ - デコーダ型トランスフォーマーモデルです。Helsinki-NLP/opus-100とHelsinki-NLP/europarlのen-itセクションで学習されました。

🚀 クイックスタート

クワドリフォリオは、英語とイタリア語のテキスト翻訳用のエンコーダ - デコーダ型トランスフォーマーモデルです。bigscience/mt0-smallをベースに構築され、Helsinki-NLP/opus-100とHelsinki-NLP/europarlのen-itセクションで訓練されました。

✨ 主な機能

英語からイタリア語へのテキスト翻訳を行うことができます。
bigscience/mt0-smallをベースにしているため、軽量で高速な推論が可能です。

💻 使用例

基本的な使用法

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

# Load model and tokenizer from checkpoint directory
tokenizer = AutoTokenizer.from_pretrained("LeonardPuettmann/Quadrifoglio-mt-en-it")
model = AutoModelForSeq2SeqLM.from_pretrained("LeonardPuettmann/Quadrifoglio-mt-en-it")

def generate_response(input_text):
    input_ids = tokenizer("translate English to Italian:" + input_text, return_tensors="pt").input_ids
    output = model.generate(input_ids, max_new_tokens=256)
    return tokenizer.decode(output[0], skip_special_tokens=True)

text_to_translate = "I would like a cup of green tea, please."
response = generate_response(text_to_translate)
print(response)

高度な使用法

このモデルは文ペアの翻訳で学習されているため、長いテキストを個々の文に分割することが最適です。理想的にはSpaCyを使用します。その後、文を翻訳し、最後に翻訳結果を結合することができます。

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
import spacy
# First, install spaCy and the English language model if you haven't already
# !pip install spacy
# !python -m spacy download en_core_web_sm

nlp = spacy.load("en_core_web_sm")

tokenizer = AutoTokenizer.from_pretrained("LeonardPuettmann/Quadrifoglio-mt-en-it")
model = AutoModelForSeq2SeqLM.from_pretrained("LeonardPuettmann/Quadrifoglio-mt-en-it")

def generate_response(input_text):
    input_ids = tokenizer("translate Italian to English: " + input_text, return_tensors="pt").input_ids
    output = model.generate(input_ids, max_new_tokens=256)
    return tokenizer.decode(output[0], skip_special_tokens=True)

text = "How are you doing? Today is a beautiful day. I hope you are doing fine."
doc = nlp(text)
sentences = [sent.text for sent in doc.sents]

sentence_translations = []
for i, sentence in enumerate(sentences):
    sentence_translation = generate_response(sentence)
    sentence_translations.append(sentence_translation)

full_translation = " ".join(sentence_translations)
print(full_translation)