Nous-Hermes-2-Mistral-7B-DPO-AWQオープンソースAIモデル - 最適化テストで優れた性能を発揮し、使いやすい！

ホーム

Nous Hermes 2 Mistral 7B DPO AWQ

solidrustによって開発

Nous Hermes 2は、Mistral 7B DPOをベースにした次世代の旗艦級7B Hermesモデルで、DPO最適化を施し、複数のテストベンチマークで優れた性能を発揮します。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #GPT4レベルの対話 #DPO最適化 #7B軽量化

ダウンロード数 84

リリース時間 : 2/22/2024

モデル概要

このモデルは、Mistral 7Bアーキテクチャに基づく大規模言語モデルで、DPO（直接嗜好最適化）による訓練を行い、命令の遵守と対話生成タスクに特化しています。

モデル特徴

DPO最適化

直接嗜好最適化による訓練を行い、AGIEval、BigBench Reasoningなどのベンチマークテストでより優れた性能を発揮します。

高品質の訓練データ

100万件のGPT - 4品質以上の命令/対話データを使用して訓練されています。

AWQ量子化サポート

4ビットのAWQ量子化をサポートし、品質を維持しながら推論効率を向上させます。

ChatML形式サポート

標準化されたChatMLプロンプトテンプレートを使用し、対話システムへの統合を容易にします。

モデル能力

テキスト生成

対話システム

命令遵守

推論能力

使用事例

対話システム

スマートアシスタント

複雑な命令を理解し、自然な応答を生成できるAIアシスタントを構築します。

複数のベンチマークテストでベースモデルよりも優れた性能を発揮します。

教育アプリケーション

教学支援

教学内容の生成や学生の質問に対する解答に使用します。

🚀 Nous Hermes 2 - Mistral 7B - DPO

Nous Hermes 2 - Mistral 7B - DPOは、高性能なテキスト生成モデルです。DPO手法により、様々なベンチマークで優れた性能を発揮します。

🚀 クイックスタート

このモデルを使用するには、まず必要なパッケージをインストールする必要があります。その後、Pythonコードを用いてモデルをロードし、テキスト生成を行うことができます。

✨ 主な機能

高性能：DPO手法により、AGIEval、BigBench Reasoning、GPT4All、TruthfulQAなどのベンチマークで優れた性能を発揮します。
多様なデータで学習：1,000,000件のGPT-4品質以上の命令/チャットデータ、主に合成データやその他の高品質データセットを使用して学習されています。
AWQ量子化対応：AWQという効率的で高速な低ビット量子化手法に対応しており、高速な推論が可能です。

📦 インストール

必要なパッケージをインストールするには、以下のコマンドを実行します。

pip install --upgrade autoawq autoawq-kernels

💻 使用例

基本的な使用法

from awq import AutoAWQForCausalLM
from transformers import AutoTokenizer, TextStreamer

model_path = "solidrust/Nous-Hermes-2-Mistral-7B-DPO-AWQ"
system_message = "You are Hermes, incarnated a powerful AI."

# Load model
model = AutoAWQForCausalLM.from_quantized(model_path,
                                          fuse_layers=True)
tokenizer = AutoTokenizer.from_pretrained(model_path,
                                          trust_remote_code=True)
streamer = TextStreamer(tokenizer,
                        skip_prompt=True,
                        skip_special_tokens=True)

# Convert prompt to tokens
prompt_template = """\
<|im_start|>system
{system_message}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant"""

prompt = "You're standing on the surface of the Earth. "\
        "You walk one mile south, one mile west and one mile north. "\
        "You end up exactly where you started. Where are you?"

tokens = tokenizer(prompt_template.format(system_message=system_message,prompt=prompt),
                  return_tensors='pt').input_ids.cuda()

# Generate output
generation_output = model.generate(tokens,
                                  streamer=streamer,
                                  max_new_tokens=512)

📚 ドキュメント

モデルの詳細

モデル作成者：NousResearch
元のモデル：OpenHermes Mistral 2.5 7B DPO
学習データセット：teknium/OpenHermes-2.5

プロンプトテンプレート

<|im_start|>system
{system_message}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

引用情報

@misc{Nous-Hermes-2-Mistral-7B-DPO, 
      url={[https://huggingface.co/NousResearch/Nous-Hermes-2-Mistral-7B-DPO](https://huggingface.co/NousResearch/Nous-Hermes-2-Mistral-7B-DPO)}, 
      title={Nous Hermes 2 Mistral 7B DPO}, 
      author={"Teknium", "theemozilla", "karan4d", "huemin_art"}
}

モデル情報テーブル

属性	詳情
モデルタイプ	テキスト生成モデル
学習データ	1,000,000件のGPT-4品質以上の命令/チャットデータ、主に合成データやその他の高品質データセット
量子化手法	AWQ (4-bit)
サポート環境	Linux、Windows (NVidia GPUのみ)
ライセンス	Apache-2.0