Qwen2-7B-Instruct-Better-Translationオープンソース言語モデル - 英語から中国語への翻訳を最適化し、流暢で地道な訳文を出力する

ホーム

Qwen2 7B Instruct Better Translation

sevenoneによって開発

Qwen2-7B-Instructをファインチューニングした言語モデルで、英中日訳タスクに特化して最適化されており、逐語訳よりも流暢で自然な翻訳を優先します。

機械翻訳

Safetensors

英語オープンソースライセンス:Apache-2.0 #自然な英中日訳 #DPO最適化翻訳 #自然言語処理

ダウンロード数 19

リリース時間 : 9/17/2024

モデル概要

このモデルは直接選好最適化（DPO）手法を用いてファインチューニングされており、複雑なニュアンスを含む英文を正確かつ流暢に翻訳する必要があるユーザーに特に適しています。

モデル特徴

自然な翻訳優先

直接選好最適化手法を採用し、逐語訳よりも流暢で自然な翻訳を優先

大規模コンテキスト対応

Qwen2-7B-Instructの131,072トークンという長いコンテキスト処理能力を継承

専門的なファインチューニング

英中日訳選好カスタムデータセットを使用してファインチューニングし、翻訳品質を最適化

モデル能力

英中日訳

自然言語生成

長文処理

使用事例

翻訳サービス

専門文書翻訳

技術文書、学術論文などの専門的内容の翻訳

中国語の表現習慣に合致した専門的な訳文を生成

文学翻訳

文学作品や微妙なニュアンスを含むテキストの翻訳

原文のニュアンスを保持しつつ中国語の表現習慣に適合

🚀 Qwen2-7B-Instruct-Better-Translation

Qwen2-7B-Instruct-Better-Translationは、Qwen2-7B-Instructをベースにした言語モデルで、英語から中国語への翻訳を改善するために最適化されています。

🚀 クイックスタート

Qwen2-7B-Instruct-Better-Translationは、高品質な英語から中国語への翻訳を提供するように設計されています。特に、逐語的な翻訳ではなく、自然で慣用的な翻訳を生成することに重点を置いています。

✨ 主な機能

Qwen2-7B-Instructをベースにした言語モデルで、英語から中国語への翻訳を最適化。
自然で慣用的な翻訳を生成するように微調整されています。
複雑なニュアンスのある英語のテキストに対しても正確で流暢な翻訳を提供します。

📦 インストール

このモデルを使用するには、互換性の問題を避けるために、transformers>=4.37.0をインストールしてください。

💻 使用例

基本的な使用法

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_id = "sevenone/Qwen2-7B-Instruct-Better-Translation"
device = "cuda"  # load onto GPU if available

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype="auto",
    device_map="auto"
)

prompt = "Translate the following sentence to Chinese: 'Artificial intelligence is transforming industries worldwide.'"
messages = [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": prompt}
]

# Apply the chat template for better generation
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)

# Generate translation
generated_ids = model.generate(
    model_inputs.input_ids,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

📚 ドキュメント

モデル概要

Qwen2-7B-Instruct-Better-Translationは、Qwen2-7B-Instructをベースにした微調整された言語モデルで、英語から中国語への翻訳を改善するために特に最適化されています。このモデルは、Direct Preference Optimization (DPO) を使用して、流暢で慣用的な翻訳 (選択) を逐語的な翻訳 (拒否) よりも優先するカスタムデータセットで微調整されました。

開発者

sevenone

詳細情報

項目	詳細
ライセンス	Qwen2 License
ベースモデル	Qwen2-7B-Instruct
モデルサイズ	7B
コンテキスト長	131,072トークン (Qwen2-7B-Instructから継承)

詳細については、GitHubを参照してください。

トレーニングの詳細

このモデルは、Direct Preference Optimization (DPO) を使用して微調整されました。これは、ユーザーが提供した嗜好に基づいて、モデルが特定の出力を他の出力よりも好むように最適化する方法です。トレーニングデータセットは、英語の原文と、対応する翻訳が「選択」 (慣用的) または「拒否」 (逐語的) としてラベル付けされたもので構成されています。

トレーニングフレームワーク: Hugging Face Transformers
オプティマイザ: AdamW
トレーニング方法: Lora with direct preference optimization
トレーニングデータ: 英語から中国語への翻訳用のカスタム嗜好データセット
嗜好タイプ: 慣用的な翻訳 (選択) を逐語的な翻訳 (拒否) よりも優先

📄 ライセンス

Qwen2 License

引用

もしsevenone/qwen2-7b-instruct-better-translationがあなたの作業に役立った場合は、以下のように引用してください。

@misc{sevenone_2024,
    author       = {sevenone},
    title        = {Qwen2-7B-Instruct-Better-Translation},
    year         = 2024,
    url          = {https://huggingface.co/sevenone/Qwen2-7B-Instruct-Better-Translation},
    publisher    = {Hugging Face}
}