Daredevil - 8Bオープンソーススーパー融合モデル - 2024年MMLUスコアが最も高いLlama 3 8Bモデル

ホーム

Daredevil 8B

mlabonneによって開発

Daredevil-8BはMMLUスコアを最大化するために設計されたスーパーフュージョンモデルで、2024年5月27日時点でMMLUスコアが最も高いLlama 3 8Bモデルです。

大規模言語モデル

Transformers

オープンソースライセンス:その他 #MMLU高スコア #マルチモデル融合 #知識推論

ダウンロード数 238

リリース時間 : 5/25/2024

モデル概要

Daredevil-8BはLlama 3 8Bアーキテクチャを基にしたフュージョンモデルで、複数の高品質モデルを融合することでMMLU性能を最適化し、Meta-Llama-3-8B-Instructの強化版として使用できます。

モデル特徴

高性能MMLUスコア

MMLUベンチマークで最高のパフォーマンスを発揮し、69.24%の精度を達成

マルチモデル融合

9つの高品質なLlama 3 8Bバリアントモデルを融合

コンテンツ審査

コンテンツ審査済みバージョンで、セキュリティに敏感なアプリケーションに適しています

モデル能力

テキスト生成

質問応答システム

知識推論

対話システム

使用事例

教育

知識質問応答

教育分野の知識質問応答システムに使用

MMLUベンチマークで優れたパフォーマンス

研究

ベンチマークテスト

言語モデルの性能研究とベンチマークテストに使用

複数のベンチマークテストで優れたパフォーマンス

🚀 Daredevil-8B

Daredevil-8Bは、MMLUを最大化するように設計されたメガマージモデルです。2024年5月27日現在、これはLlama 3 8Bモデルの中で最も高いMMLUスコアを誇るモデルです。私の経験では、Llama 3モデルにおいて高いMMLUスコアが必要とされることが多いです。

image/jpeg

🚀 クイックスタート

Daredevil-8Bは、meta-llama/Meta-Llama-3-8B-Instructの改良版として使用することができます。これは検閲されたモデルです。検閲されていないバージョンについては、mlabonne/Daredevil-8B-abliteratedを参照してください。このモデルは、LM Studioの「Llama 3」プリセットでテストされています。

✨ 主な機能

Daredevil-8Bは、以下のモデルをLazyMergekitを使用してマージしたものです。

nbeerbower、Hastagaras、openchat、Kukedlc、cstr、flammenai、KingNishの皆さんにはマージに関する貢献を、Charles GoddardとArcee.aiにはMergeKitを提供してくれたことに感謝します。

📦 インストール

以下のコマンドを使用して必要なライブラリをインストールできます。

!pip install -qU transformers accelerate

💻 使用例

基本的な使用法

# 必要なライブラリのインポート
from transformers import AutoTokenizer
import transformers
import torch

# モデルの指定
model = "mlabonne/Daredevil-8B"
messages = [{"role": "user", "content": "What is a large language model?"}]

# トークナイザーの初期化
tokenizer = AutoTokenizer.from_pretrained(model)
prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)

# パイプラインの設定
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)

# テキスト生成
outputs = pipeline(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
print(outputs[0]["generated_text"])

🔧 技術詳細

モデル構成

models:
  - model: NousResearch/Meta-Llama-3-8B
    # No parameters necessary for base model
  - model: nbeerbower/llama-3-stella-8B
    parameters:
      density: 0.6
      weight: 0.16
  - model: Hastagaras/llama-3-8b-okay
    parameters:
      density: 0.56
      weight: 0.1
  - model: nbeerbower/llama-3-gutenberg-8B
    parameters:
      density: 0.6
      weight: 0.18
  - model: openchat/openchat-3.6-8b-20240522
    parameters:
      density: 0.56
      weight: 0.12
  - model: Kukedlc/NeuralLLaMa-3-8b-DT-v0.1
    parameters:
      density: 0.58
      weight: 0.18
  - model: cstr/llama3-8b-spaetzle-v20
    parameters:
      density: 0.56
      weight: 0.08
  - model: mlabonne/ChimeraLlama-3-8B-v3
    parameters:
      density: 0.56
      weight: 0.08
  - model: flammenai/Mahou-1.1-llama3-8B
    parameters:
      density: 0.55
      weight: 0.05
  - model: KingNish/KingNish-Llama3-8b
    parameters:
      density: 0.55
      weight: 0.05
merge_method: dare_ties
base_model: NousResearch/Meta-Llama-3-8B
dtype: bfloat16

🏆 評価

Open LLM Leaderboard

Daredevil-8Bは、Open LLM LeaderboardにおいてMMLUスコアの面で最も優れた8Bモデルです（2024年5月27日）。

image/png

Nous

Daredevil-8Bは、Nousのベンチマークスイートにおいて最も優れた8Bモデルです（評価はLLM AutoEvalを使用して行われました、2024年5月27日）。全体のリーダーボードはこちらで確認できます。

モデル	平均	AGIEval	GPT4All	TruthfulQA	Bigbench
mlabonne/Daredevil-8B 📄	55.87	44.13	73.52	59.05	46.77
mlabonne/Daredevil-8B-abliterated 📄	55.06	43.29	73.33	57.47	46.17
mlabonne/Llama-3-8B-Instruct-abliterated-dpomix 📄	52.26	41.6	69.95	54.22	43.26
meta-llama/Meta-Llama-3-8B-Instruct 📄	51.34	41.22	69.86	51.65	42.64
failspy/Meta-Llama-3-8B-Instruct-abliterated-v3 📄	51.21	40.23	69.5	52.44	42.69
mlabonne/OrpoLlama-3-8B 📄	48.63	34.17	70.59	52.39	37.36
meta-llama/Meta-Llama-3-8B 📄	45.42	31.1	69.95	43.91	36.7