MMRExCEV - GRPO - v0.420オープンソース言語モデル - デュアルモデルの優位性を融合した実用的な新選択肢

ホーム

Mmrexcev GRPO V0.420

Nitral-Archiveによって開発

これはSLERP法によって融合された事前学習済み言語モデルで、Captain-Eris_Violet-GRPO-v0.420とMMR-E1の2つのモデルの特徴を組み合わせています。

大規模言語モデル

Transformers

#マルチタスク最適化 #注意機構の融合 #高いパラメータ効率

ダウンロード数 35

リリース時間 : 4/18/2025

モデル概要

このモデルは球面線形補間(SLERP)法を用いて2つの事前学習済み言語モデルを融合し、両者の長所を組み合わせることで自然言語処理タスクにおける性能向上を目指しています。

モデル特徴

モデル融合

SLERP法を用いて2つの事前学習モデルを融合し、それぞれの強みを組み合わせる

パラメータ最適化

自己注意機構とMLP層に対して異なる融合パラメータを採用

精度サポート

bfloat16データ型を使用し、精度と性能のバランスを実現

モデル能力

テキスト生成

言語理解

テキスト分類

使用事例

テキスト生成

クリエイティブライティング

物語や詩などの創造的なテキストコンテンツを生成

対話システム

インテリジェントカスタマーサポート

自然で流暢な対話システムを構築

🚀 モデルマージプロジェクト

このプロジェクトは、事前学習された言語モデルをマージすることで新しいモデルを作成します。mergekitを使用してモデルのマージを行っています。

🚀 クイックスタート

このマージされたモデルは、事前学習された複数の言語モデルを組み合わせることで生成されています。以下にマージの詳細を説明します。

✨ 主な機能

複数の事前学習モデルをマージして新しいモデルを作成できます。
SLERPマージ方法を使用しています。

📦 インストール

このREADMEには具体的なインストール手順が記載されていないため、このセクションは省略されます。

💻 使用例

このREADMEには具体的なコード例が記載されていないため、このセクションは省略されます。

📚 ドキュメント

マージの詳細

マージ方法

このモデルは、SLERPマージ方法を使用してマージされています。

マージされたモデル

以下のモデルがマージに含まれています。

設定

以下のYAML設定を使用してこのモデルが生成されています。

slices:
  - sources:
      - model: Nitral-AI/MMR-E1
        layer_range: [0, 40]
      - model: Nitral-AI/Captain-Eris_Violet-GRPO-v0.420
        layer_range: [0, 40]
merge_method: slerp
base_model: Nitral-AI/MMR-E1
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.420
dtype: bfloat16