ALMA-13B-Rオープンソース機械翻訳モデル - GPT-4やチャンピオンモデルを上回る性能、効率的な翻訳の第一選択

ホーム

ALMA 13B R

haoranxuによって開発

ALMA-13B-RはALMAモデルを基に開発された機械翻訳モデルで、対照選好最適化（CPO）を用いたLoRAファインチューニングにより、GPT-4やWMT優勝モデルを凌駕する性能を発揮します。

機械翻訳

Transformers

オープンソースライセンス:MIT #対照選好最適化 #GPT-4翻訳を超える #LoRAファインチューニング

ダウンロード数 4,216

リリース時間 : 1/17/2024

モデル概要

ALMA-13B-Rは高性能な機械翻訳モデルで、対照選好最適化技術により翻訳品質を向上させ、複数の言語ペアの翻訳タスクをサポートします。

モデル特徴

対照選好最適化（CPO）

革新的な対照選好最適化手法を用いたLoRAファインチューニングにより、翻訳品質を大幅に向上させます。

高性能翻訳

複数のテストセットにおいてGPT-4やWMT優勝モデルを上回る翻訳精度を達成。

LoRAファインチューニング

LoRA（低ランク適応）技術を使用した効率的なファインチューニングにより、計算リソース要件を低減。

モデル能力

高品質な機械翻訳

多言語翻訳

文脈理解

使用事例

専門翻訳

技術文書翻訳

技術文書をある言語から別の言語へ翻訳し、専門用語の正確性を保持します。

専門家による人工翻訳と同等の水準

文学翻訳

文学作品の高品質な翻訳で、原文のスタイルとニュアンスを保持。

従来の機械翻訳システムを凌駕

ビジネス応用

多国籍企業コミュニケーション

企業内の異言語間コミュニケーションを支援する即時翻訳を提供。

コミュニケーション効率の向上

🚀 [ALMA-R]

ALMA-R は、ALMAモデルをベースに構築されています。ALMAで使用されている教師あり微調整ではなく、提案されたContrastive Preference Optimization (CPO) を用いてさらにLoRA微調整を行っています。CPO微調整には、嗜好学習のためにトリプレット嗜好データが必要です。ALMA-Rは、現在、GPT-4やWMTの優勝モデルと同等、あるいはそれを上回る性能を発揮することができます！

@misc{xu2024contrastive,
      title={Contrastive Preference Optimization: Pushing the Boundaries of LLM Performance in Machine Translation}, 
      author={Haoran Xu and Amr Sharaf and Yunmo Chen and Weiting Tan and Lingfeng Shen and Benjamin Van Durme and Kenton Murray and Young Jin Kim},
      year={2024},
      eprint={2401.08417},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

@misc{xu2023paradigm,
      title={A Paradigm Shift in Machine Translation: Boosting Translation Performance of Large Language Models}, 
      author={Haoran Xu and Young Jin Kim and Amr Sharaf and Hany Hassan Awadalla},
      year={2023},
      eprint={2309.11674},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

🚀 クイックスタート

このセクションでは、最良のシステムであるALMA-13B-Rを使った翻訳のクイックスタートを紹介します。「我爱机器翻译。」を英語に翻訳する例を示します。

import torch
from transformers import AutoModelForCausalLM
from transformers import AutoTokenizer

# ベースモデルとLoRAの重みをロード
model = AutoModelForCausalLM.from_pretrained("haoranxu/ALMA-13B-R", torch_dtype=torch.float16, device_map="auto")
tokenizer = AutoTokenizer.from_pretrained("haoranxu/ALMA-13B-R", padding_side='left')

# ソース文をプロンプトテンプレートに追加
prompt="Translate this from Chinese to English:\nChinese: 我爱机器翻译。\nEnglish:"
input_ids = tokenizer(prompt, return_tensors="pt", padding=True, max_length=40, truncation=True).input_ids.cuda()

# 翻訳
with torch.no_grad():
    generated_ids = model.generate(input_ids=input_ids, num_beams=5, max_new_tokens=20, do_sample=True, temperature=0.6, top_p=0.9)
outputs = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
print(outputs)

✨ 主な機能

ALMA-RはALMAモデルをベースに、CPOを用いたLoRA微調整を行っています。
トリプレット嗜好データを用いた嗜好学習により、翻訳性能が向上しています。
GPT-4やWMTの優勝モデルと同等、あるいはそれを上回る性能を発揮します。

📦 インストール

このREADMEには具体的なインストール手順が記載されていないため、このセクションを省略します。

💻 使用例

基本的な使用法

上記のクイックスタートで示したコードが基本的な使用例です。

📚 ドキュメント

詳細については、GitHubリポジトリを参照してください。

📄 ライセンス

このプロジェクトはMITライセンスの下で公開されています。

モデルとデータセットのダウンロード 🚀

論文で提示された6つの翻訳モデルをリリースしています。

ALMA-7B
ALMA-7B-LoRA
ALMA-7B-R (NEW!)：ALMA-7B-LoRAに対して、対照的嗜好最適化によるさらなるLoRA微調整を行ったもの。
ALMA-13B
ALMA-13B-LoRA
ALMA-13B-R (NEW!)：ALMA-13B-LoRAに対して、対照的嗜好最適化によるさらなるLoRA微調整を行ったもの（最良のモデル！）。

モデルのチェックポイントはHugging Faceで公開されています。

モデル	ベースモデルリンク	LoRAリンク
ALMA-7B	haoranxu/ALMA-7B	-
ALMA-7B-LoRA	haoranxu/ALMA-7B-Pretrain	haoranxu/ALMA-7B-Pretrain-LoRA
ALMA-7B-R (NEW!)	haoranxu/ALMA-7B-R (LoRA merged)	-
ALMA-13B	haoranxu/ALMA-13B	-
ALMA-13B-LoRA	haoranxu/ALMA-13B-Pretrain	haoranxu/ALMA-13B-Pretrain-LoRA
ALMA-13B-R (NEW!)	haoranxu/ALMA-13B-R (LoRA merged)	-