Llama_3.1_8b_Medusa_v1.01オープンソース言語モデル - 様々なテキスト生成タスクを見事にこなす

ホーム

Llama 3.1 8b Medusa V1.01

Nexesenexによって開発

Llama 3.1アーキテクチャに基づく8Bパラメータの言語モデルで、mergekitを使って複数の専門モデルをマージして作成され、テキスト生成タスクで優れた性能を発揮します。

大規模言語モデル

Transformers

#指令微調整 #多タスク汎化 #ゼロサンプル推論

ダウンロード数 95

リリース時間 : 2/27/2025

モデル概要

これは、複数の専門モデル（Mediver、Smarteaz、Dobby - Mini - Unhinged）をマージして作成された8Bパラメータの言語モデルで、テキスト生成タスクに特化し、複数のベンチマークテストで優れた性能を示します。

モデル特徴

多モデルマージ

mergekitを使って複数の専門モデル（Mediver、Smarteaz、Dobby - Mini - Unhinged）をマージし、各モデルの長所を総合します。

高性能テキスト生成

IFEvalなどのテキスト生成ベンチマークテストで優れた性能を発揮し、厳密な正解率は76.85%です。

広範なベンチマークテスト

BBH、MATH、GPQA、MuSR、MMLU - PROなどの複数のベンチマークテストで評価されます。

モデル能力

テキスト生成

指令追従

知識問答

数学的推論

使用事例

教育

数学問題の解答

様々な数学問題、特に競技レベルの問題を解答します。

MATH Lvl 5テストで14.65%の完全一致率を達成しました。

研究

複雑な問題の研究

研究員がGPQAなどの複雑な科学問題を処理するのを支援します。

GPQAテストで5.59%の正規化正解率を達成しました。

汎用AIアシスタント

指令実行

複雑な指令を正確に理解して実行します。

IFEvalテストで76.85%の厳密な正解率を達成しました。

🚀 Llama_3.1_8b_Medusa_v1.01

このモデルは、事前学習された言語モデルをmergekitを使用してマージしたものです。テキスト生成タスクに適しており、複数のデータセットで評価されています。

📚 ドキュメント

モデル情報

属性	详情
ライブラリ名	transformers
モデルタイプ	Llama_3.1_8b_Medusa_v1.01
ベースモデル	Nexesenex/Llama_3.1_8b_Mediver_V1.01、SentientAGI/Dobby-Mini-Unhinged-Llama-3.1-8B、Nexesenex/Llama_3.1_8b_Smarteaz_V1.01
ライセンス	llama3.1

マージ詳細

マージ方法

このモデルは、Model Stockマージ方法を使用し、SentientAGI/Dobby-Mini-Unhinged-Llama-3.1-8Bをベースにマージされました。

マージされたモデル

以下のモデルがマージに含まれています：

設定

このモデルを生成するために使用されたYAML設定は次の通りです：

merge_method: model_stock
models:
  - model: Nexesenex/Llama_3.1_8b_Mediver_V1.01
    parameters:
      weight: 1.0
  - model: Nexesenex/Llama_3.1_8b_Smarteaz_V1.01
    parameters:
      weight: 1.0
base_model: SentientAGI/Dobby-Mini-Unhinged-Llama-3.1-8B
dtype: bfloat16
normalize: true
chat_template: auto
tokenizer:
  source: union

Open LLM Leaderboard評価結果

詳細な結果はこちらで確認できます。

指標	値
平均	27.38
IFEval (0-Shot)	76.85
BBH (3-Shot)	30.03
MATH Lvl 5 (4-Shot)	14.65
GPQA (0-shot)	5.59
MuSR (0-shot)	9.03
MMLU-PRO (5-shot)	28.13

モデル指標

タスク	データセット	指標	値	ソース
テキスト生成	IFEval (0-Shot) (HuggingFaceH4/ifeval)	strict accuracy	76.85	Open LLM Leaderboard
テキスト生成	BBH (3-Shot) (BBH)	normalized accuracy	30.03	Open LLM Leaderboard
テキスト生成	MATH Lvl 5 (4-Shot) (hendrycks/competition_math)	exact match	14.65	Open LLM Leaderboard
テキスト生成	GPQA (0-shot) (Idavidrein/gpqa)	acc_norm	5.59	Open LLM Leaderboard
テキスト生成	MuSR (0-shot) (TAUR-Lab/MuSR)	acc_norm	9.03	Open LLM Leaderboard
テキスト生成	MMLU-PRO (5-shot) (TIGER-Lab/MMLU-Pro)	accuracy	28.13	Open LLM Leaderboard