orca_mini_v5_8b_dpoオープンソーステキスト生成モデル - Llama 3をベースに無料で高品質なテキストを生成

ホーム

Orca Mini V5 8b Dpo

pankajmathurによって開発

Llama 3アーキテクチャに基づく8Bパラメータモデル、複数のDPOデータセットでトレーニングされ、テキスト生成タスクに特化

大規模言語モデル

Transformers

英語#命令微調整最適化 #マルチタスクテキスト生成 #学術ベンチマークテスト

ダウンロード数 16

リリース時間 : 5/30/2024

モデル概要

これはDPO（直接選好最適化）でトレーニングされたテキスト生成モデルで、Llama 3アーキテクチャに基づき、パラメータ規模は8Bです。モデルは複数のベンチマークテストで良好なパフォーマンスを示し、汎用テキスト生成タスクに適しています。

モデル特徴

DPOトレーニング

複数の直接選好最適化(DPO)データセットを使用してトレーニングされ、モデルの生成品質が向上

汎用テキスト生成

質問応答、コンテンツ作成など、様々なテキスト生成タスクに適している

オープンライセンス

ユーザーがこのモデルを基にさらなる微調整や統合を行うことを許可

モデル能力

テキスト生成

質問応答システム

コンテンツ作成

命令追従

使用事例

教育

教育用質問応答

学生が提出する様々な学術的な質問に回答するために使用

MMLU-Proテストで23.51%の精度を達成

研究

学術執筆支援

研究者が論文の草稿や要約を生成するのを支援

ビジネス

コンテンツ生成

マーケティングコピーや製品説明を自動生成

🚀 llama_3_orca_mini_v5_8b_dpo

llama_3_orca_mini_v5_8bは、様々なDPOデータセットを用いて訓練されたモデルで、汎用的な自然言語処理タスクに対応しています。

"GenAIの可能性に魅了されていますか？私もそうです！一緒に創造しましょう 🚀 https://www.linkedin.com/in/pankajam"

🚀 クイックスタート

適切なクレジットと帰属表示を行うことで、このモデルを基礎として、完全なファインチューニング、DPO、PPOまたはORPOのチューニング、およびあらゆる種類のマージを行うことが許可されます。このバージョンは包括的な汎用モデルとして設計されているため、ユーザーが特定のニーズに合わせてモデルをカスタマイズし、強化することを積極的に奨励します。是非、挑戦して革新してください！

✨ 主な機能

適切なクレジットと帰属表示を行えば、様々なチューニングやマージが可能。
汎用的な自然言語処理タスクに対応。

📚 ドキュメント

評価結果

メトリック	値
平均	67.78
AI2 Reasoning Challenge (25-Shot)	61.86
HellaSwag (10-Shot)	82.35
MMLU (5-Shot)	65.10
TruthfulQA (0-shot)	56.24
Winogrande (5-shot)	73.40
GSM8k (5-shot)	67.70

Open LLM Leaderboard評価結果

詳細な結果はこちらで確認できます。

メトリック	値
平均	19.96
IFEval (0-Shot)	48.96
BBH (3-Shot)	29.61
MATH Lvl 5 (4-Shot)	7.48
GPQA (0-shot)	3.24
MuSR (0-shot)	6.94
MMLU-PRO (5-shot)	23.51

💻 使用例

基本的な使用法

これはChatMLのプロンプトフォーマットです。

<|im_start|>system
You are Orca Mini, a helpful AI assistant.<|im_end|>
<|im_start|>user
Hello Orca Mini, what can you do for me?<|im_end|>
<|im_start|>assistant

以下はこのモデルを使用するコード例です。

from transformers import AutoModel, AutoTokenizer
model_slug = "pankajmathur/orca_mini_v5_8b_dpo"
model = AutoModel.from_pretrained(model_slug)
tokenizer = AutoTokenizer.from_pretrained(model_slug)

messages = [
    {"role": "system", "content": "You are Orca Mini, a helpful AI assistant."},
    {"role": "user", "content": "Hello Orca Mini, what can you do for me?"}
]

gen_input = tokenizer.apply_chat_template(messages, return_tensors="pt")
model.generate(**gen_input)