Aurora - Borealis - LLaMa - 70Bオープンソースマルチモデル融合プロジェクト、マルチバージョンモデル融合の新体験をもたらす

ホーム

Aurora Borealis LLaMa 70B

Tarek07によって開発

これはLLaMa-70Bアーキテクチャを基にしたマルチモデル融合実験プロジェクトで、DARE TIES融合手法を用いて6つの異なるバージョンのMO-MODELモデルを組み合わせています。

大規模言語モデル

Transformers

#マルチモデル融合 #DARE TIES技術 #70Bパラメータ

ダウンロード数 112

リリース時間 : 5/1/2025

モデル概要

専門的なモデル融合実験の成果で、勾配技術を使用して各モデルが最終的な融合結果に与える影響を精密に制御する試みです。高度な自然言語処理タスクに適しています。

モデル特徴

マルチモデル融合

6つの異なるバージョンの70Bパラメータモデルを融合し、DARE TIES手法で精密制御を実現

勾配技術の応用

融合プロセスで勾配技術を試用し、各モデルの最終結果への貢献を最適化

高精度要件

Q5量子化未満の設定での実行は推奨せず、モデル性能を保証

モデル能力

テキスト生成

言語理解

複雑な推論

使用事例

研究開発

モデル融合技術の研究

マルチモデル融合手法と効果評価の研究に使用

異なる重み設定下での融合効果比較を提供

自然言語処理

高度なテキスト生成

高品質で一貫性のある長文コンテンツを生成

🚀 MERGE2

このモデルは、事前学習された言語モデルをマージしたもので、mergekit を使用して作成されています。以前はMO-MODEL-Fused-V0.6-LLaMa-70Bとして知られていました。専用のモデルをマージする実験の一環で、今回は勾配を使った実験を行い、最終的なマージ結果に対するより細かいコントロールを試みました。

image/png

🚀 クイックスタート

推奨されるサンプラー設定は以下の通りです。

Temp 1.0
Min P 0.02

この種の「Hyper Multi Model Merge」の性質上、Q5量子化以下のものでは実行しないことをおすすめします。

もし私の作品が気に入ってくれるなら、応援をご検討ください。これにより、このようなモデルをもっと作ることができます！ KO-FIで応援 <3

✨ 主な機能

このモデルは、事前学習された言語モデルをマージすることで作成されており、勾配を使ったマージ方法を用いることで、最終的なマージ結果に対する細かいコントロールが可能です。

📦 インストール

元文書にインストール手順が記載されていないため、このセクションは省略されます。

💻 使用例

元文書にコード例が記載されていないため、このセクションは省略されます。

📚 ドキュメント

マージの詳細

マージ方法

このモデルは、DARE TIES マージ方法を使用して、TareksLab/MO-MODEL6-V0.1-LLaMa-70B をベースにマージされました。

マージされたモデル

以下のモデルがマージに含まれています。

設定

このモデルを生成するために使用されたYAML設定は以下の通りです。

models:
  - model: TareksLab/MO-MODEL6-V0.1-LLaMa-70B
    parameters:
      weight: [0.1, 0.1, 0.1, 0.2, 0.5]
      density: 0.5
  - model: TareksLab/MO-MODEL4-V0.1-LLaMa-70B
    parameters:
      weight: [0.1, 0.1, 0.2, 0.4, 0.2]
      density: 0.5
  - model: TareksLab/MO-MODEL5-V0.3-LLaMa-70B
    parameters:
      weight: [0.1, 0.2, 0.4, 0.2, 0.1]
      density: 0.5
  - model: TareksLab/MO-MODEL3-V0.2-LLaMa-70B
    parameters:
      weight: [0.2, 0.4, 0.2, 0.1, 0.1]
      density: 0.5
  - model: TareksLab/MO-MODEL2-V0.2-LLaMa-70B
    parameters:
      weight: [0.5, 0.2, 0.1, 0.1, 0.1]
      density: 0.5
  - model: TareksLab/MO-MODEL1-V1-LLaMa-70B
    parameters:
      weight: 0.10
      density: 0.5
merge_method: dare_ties
base_model: TareksLab/MO-MODEL6-V0.1-LLaMa-70B
parameters:
  normalize: false
  int8_mask: true
dtype: float32
out_dtype: bfloat16
chat_template: llama3
tokenizer:
 source: base

🔧 技術詳細

元文書に技術詳細が記載されていないため、このセクションは省略されます。

📄 ライセンス

このモデルのライセンスは llama3.3 です。

情報テーブル

属性	详情
ベースモデル	TareksLab/MO-MODEL3-V0.2-LLaMa-70B、TareksLab/MO-MODEL5-V0.3-LLaMa-70B、TareksLab/MO-MODEL2-V0.2-LLaMa-70B、TareksLab/MO-MODEL1-V1-LLaMa-70B、TareksLab/MO-MODEL6-V0.1-LLaMa-70B、TareksLab/MO-MODEL4-V0.1-LLaMa-70B
ライブラリ名	transformers
タグ	mergekit、merge
ライセンス	llama3.3