Qwen2.5-Dyanka-7B-Previewオープンソース言語モデル - 複数モデルを融合した会話型質問応答、超実用的

ホーム

Qwen2.5 Dyanka 7B Preview

Xiaojian9992024によって開発

Qwen2.5アーキテクチャに基づく7Bパラメータ規模の言語モデルで、TIESメソッドにより複数の事前学習モデルを融合

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #マルチタスクテキスト生成 #ゼロショット学習 #高精度な指示追従

ダウンロード数 1,497

リリース時間 : 2/25/2025

モデル概要

mergekitツールを使用して複数の事前学習言語モデルを融合した7Bパラメータ規模モデルで、TIES融合方法を採用し、テキスト生成と推論能力を備える

モデル特徴

マルチモデル融合

TIESメソッドで6つの異なる事前学習モデルを融合し、各モデルの強みを統合

バランス性能

様々なベンチマークテストでバランスの取れた性能を発揮、特にIFEvalで76.4%の精度を達成

オープンソースライセンス

Apache-2.0ライセンスを使用し、商業・研究用途を許可

モデル能力

テキスト生成

指示追従

論理的推論

数学問題解答

知識質問応答

使用事例

教育

数学問題解答

中学校から高校レベルの数学問題を解決

MATH Lvl 5テストで48.79%の精度を達成

研究

知識質問応答システム

専門分野の質問応答システムを構築

MMLU-PROテストで37.51%の精度を達成

🚀 Qwen2.5-Dyanka-7B-Preview

このモデルは、複数の事前学習言語モデルをmergekitを用いてマージしたもので、テキスト生成タスクにおいて一定の性能を持っています。

Qwen2.5-Dyanka-7B-Preview

🚀 クイックスタート

このモデルは、mergekitを使用して事前学習言語モデルをマージして作成されました。

✨ 主な機能

複数の事前学習言語モデルをマージして新しいモデルを作成。
テキスト生成タスクに対応。

📦 インストール

READMEにインストール手順が記載されていないため、このセクションは省略されます。

💻 使用例

READMEにコード例が記載されていないため、このセクションは省略されます。

📚 ドキュメント

マージの詳細

マージ方法

このモデルは、TIESマージ方法を使用し、gz987/qwen2.5-7b-cabs-v0.3をベースとしてマージされました。

マージされたモデル

以下のモデルがマージに含まれています。

設定

このモデルを生成するために使用されたYAML設定は以下の通りです。

models:
  - model: gz987/qwen2.5-7b-cabs-v0.3
    #no parameters necessary for base model
  - model: suayptalha/Clarus-7B-v0.1
    parameters:
      density: 0.2
      weight: 0.2
  - model: Xiaojian9992024/Qwen2.5-THREADRIPPER-Small
    parameters:
      density: 0.2
      weight: 0.2
  - model: rombodawg/Rombos-LLM-V2.5-Qwen-7b
    parameters:
      density: 0.2
      weight: 0.2
  - model: prithivMLmods/WebMind-7B-v0.1
    parameters:
      density: 0.2
      weight: 0.2
  - model: fblgit/cybertron-v4-qw7B-MGS
    parameters:
      density: 0.2
      weight: 0.2
      
merge_method: ties
base_model: gz987/qwen2.5-7b-cabs-v0.3
parameters:
  normalize: false
  int8_mask: true
dtype: bfloat16

Open LLM Leaderboardの評価結果

詳細な結果はこちらで確認できます。要約された結果はこちらで確認できます。

メトリック	値 (%)
平均	37.30
IFEval (0-Shot)	76.40
BBH (3-Shot)	36.62
MATH Lvl 5 (4-Shot)	48.79
GPQA (0-shot)	8.95
MuSR (0-shot)	15.51
MMLU-PRO (5-shot)	37.51

モデル情報

属性	詳情
ベースモデル	rombodawg/Rombos-LLM-V2.5-Qwen-7b、suayptalha/Clarus-7B-v0.1、gz987/qwen2.5-7b-cabs-v0.3、prithivMLmods/WebMind-7B-v0.1、fblgit/cybertron-v4-qw7B-MGS、Xiaojian9992024/Qwen2.5-THREADRIPPER-Small
ライブラリ名	transformers
タグ	mergekit、merge
モデル名	Qwen2.5-Dyanka-7B-Preview