NeuralHermes-2.5-Mistral-7Bオープンソース大規模言語モデル - ベンチマークテスト成績良好、無料でデプロイして効率的なコミュニケーションを実現

ホーム

Neuralhermes 2.5 Mistral 7B

mlabonneによって開発

NeuralHermesはOpenHermes-2.5-Mistral-7Bモデルを基に、直接選好最適化(DPO)でさらにファインチューニングされた大規模言語モデルで、多くのベンチマークテストで優れた性能を発揮します。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #DPOファインチューニング #ChatMLフォーマット #7B効率モデル

ダウンロード数 215

リリース時間 : 11/29/2023

モデル概要

このモデルは7Bパラメータの大規模言語モデルで、ChatMLテンプレートフォーマットを採用し、テキスト生成タスクに特化しています。DPOファインチューニングにより元のモデルの性能が向上し、オープン大規模言語モデルランキングで顕著な成果を示しています。

モデル特徴

DPOファインチューニング最適化

直接選好最適化(DPO)手法を使用してベースモデルをファインチューニングし、モデル性能を大幅に向上させました

ChatMLフォーマット対応

ChatMLテンプレートフォーマットを採用し、チャットアプリケーションシナリオでの使用を容易にしました

マルチベンチマークテストリーダー

オープン大規模言語モデルランキングで優れた成績を収め、7Bパラメータモデルの中でもトップクラスです

効率的なトレーニング

A100 GPUで約1時間のみでトレーニングが完了し、トレーニング効率が高いです

モデル能力

テキスト生成

チャット対話

質問応答システム

指示追従

使用事例

インテリジェントアシスタント

チャットボット

インテリジェントチャットアシスタントとして、自然で流暢な会話体験を提供できます

TruthfulQAベンチマークテストで54.93%の精度を達成

知識質問応答

オープンドメインQA

様々な分野の知識質問に回答します

MMLUベンチマークテストで63.32%の精度を達成

推論タスク

論理推論

論理的推論を必要とする問題を処理します

AI2推論チャレンジで66.55%の精度を達成

🚀 NeuralHermes 2.5 - Mistral 7B

NeuralHermesは、teknium/OpenHermes - 2.5 - Mistral - 7Bモデルをベースに、mlabonne/chatml_dpo_pairsデータセットを用いてDirect Preference Optimization (DPO) でさらにファインチューニングされたモデルです。多くのベンチマークで元のモデルを上回っています（結果を参照）。

このモデルは、Intel/neural - chat - 7b - v3 - 1の著者が説明したRLHFプロセスに直接インスピレーションを得て、性能を向上させています。同じデータセットを使用し、ChatMLテンプレートを適用するために再フォーマットしています。

このモデルを訓練するコードは、Google Colabと[GitHub](https://github.com/mlabonne/llm - course/tree/main)で利用可能です。約1時間のA100 GPUが必要です。

✨ 主な機能

元のモデルをベースにDPOでファインチューニングされ、多くのベンチマークで性能向上。
RLHFプロセスを参考にして開発され、同じデータセットを用いてChatMLテンプレートを適用。

📦 インストール

本READMEに具体的なインストール手順は記載されていないため、このセクションをスキップします。

💻 使用例

基本的な使用法

import transformers
from transformers import AutoTokenizer

# Format prompt
message = [
    {"role": "system", "content": "You are a helpful assistant chatbot."},
    {"role": "user", "content": "What is a Large Language Model?"}
]
tokenizer = AutoTokenizer.from_pretrained(new_model)
prompt = tokenizer.apply_chat_template(message, add_generation_prompt=True, tokenize=False)

# Create pipeline
pipeline = transformers.pipeline(
    "text-generation",
    model=new_model,
    tokenizer=tokenizer
)

# Generate text
sequences = pipeline(
    prompt,
    do_sample=True,
    temperature=0.7,
    top_p=0.9,
    num_return_sequences=1,
    max_length=200,
)
print(sequences[0]['generated_text'])

📚 ドキュメント

量子化モデル

GGUF: https://huggingface.co/TheBloke/NeuralHermes-2.5-Mistral-7B-GGUF
AWQ: https://huggingface.co/TheBloke/NeuralHermes-2.5-Mistral-7B-AWQ
GPTQ: https://huggingface.co/TheBloke/NeuralHermes-2.5-Mistral-7B-GPTQ
EXL2:
- 3.0bpw: https://huggingface.co/LoneStriker/NeuralHermes-2.5-Mistral-7B-3.0bpw-h6-exl2
- 4.0bpw: https://huggingface.co/LoneStriker/NeuralHermes-2.5-Mistral-7B-4.0bpw-h6-exl2
- 5.0bpw: https://huggingface.co/LoneStriker/NeuralHermes-2.5-Mistral-7B-5.0bpw-h6-exl2
- 6.0bpw: https://huggingface.co/LoneStriker/NeuralHermes-2.5-Mistral-7B-6.0bpw-h6-exl2
- 8.0bpw: https://huggingface.co/LoneStriker/NeuralHermes-2.5-Mistral-7B-8.0bpw-h8-exl2

結果

更新: NeuralHermes - 2.5は、Open LLMリーダーボードで最良のHermesベースのモデルとなり、7bモデルの中でもトップクラスのモデルの1つになりました。🎉

![image/png](https://cdn - uploads.huggingface.co/production/uploads/61b8e2ba285851687028d395/yWe6VBFxkHiuOlDVBXtGo.png)

Teknium（OpenHermes - 2.5 - Mistral - 7Bの著者）がモデルのベンチマークを行いました（彼のツイートを参照）。

すべてのベンチマークで結果が向上しています: AGIEval（43.07%から43.62%）、GPT4All（73.12%から73.25%）、およびTruthfulQA。

AGIEval

GPT4All

TruthfulQA

Weights & Biasesプロジェクトはこちらで確認できます。

訓練ハイパーパラメータ

LoRA:

r = 16
lora_alpha = 16
lora_dropout = 0.05
bias = "none"
task_type = "CAUSAL_LM"
target_modules = ['k_proj', 'gate_proj', 'v_proj', 'up_proj', 'q_proj', 'o_proj', 'down_proj']

訓練引数: