Legion-V2.2-LLaMa-70Bオープンソース事前学習言語モデル - 複数モデルを融合して多様なテキストニーズを満たす

ホーム

Legion V2.2 LLaMa 70B

TareksTestingによって開発

DARE TIES メソッドを使用してマージされた事前学習済み言語モデル、L-BASE-V1をベースに複数のMERGEモデルを融合

大規模言語モデル

Transformers

#DARE-TIESマージ #マルチモデル融合 #パラメータ加重混合

ダウンロード数 24

リリース時間 : 3/24/2025

モデル概要

このモデルはmergekitツールを使用して複数の事前学習済み言語モデルをマージした結果で、DARE TIESマージ方法を採用し、各モデルの強みを組み合わせて全体の性能を向上させることを目的としています。

モデル特徴

DARE TIES マージ方法

先進的なDARE TIESモデルマージ技術を採用し、複数のモデルのパラメータを効果的に統合

モジュール化重み付け

self_attnやmlpなどの異なるモジュールに対してそれぞれ重みパラメータを設定

パラメータ密度制御

densityパラメータを通じてモデルパラメータの保持比率を制御

モデル能力

テキスト生成

言語理解

使用事例

自然言語処理

テキスト生成

一貫性があり流暢なテキストコンテンツの生成に使用可能

質問応答システム

質問応答システムの構築に応用し、ユーザーの質問に回答

🚀 モデルマージ

これは、mergekitを使用して作成された事前学習言語モデルのマージです。

📚 ドキュメント

マージの詳細

マージ方法

このモデルは、DARE TIESマージ方法を使用し、TareksLab/L-BASE-V1をベースにマージされました。

マージされたモデル

以下のモデルがマージに含まれています：

設定

このモデルを生成するために、以下のYAML設定が使用されました：

models:
  - model: TareksLab/L2-MERGE4
    parameters:
      weight: 
      - filter: self_attn
        value: [0.3, 0.1, 0.2]
      - filter: mlp
        value: [0.4, 0.2, 0.1]
      - value: 0.2
      density: 0.7
      lambda: 1.05
  - model: TareksLab/L2-MERGE2a
    parameters:
      weight: 
      - filter: self_attn
        value: [0.2, 0.1, 0.3]
      - filter: mlp
        value: [0.3, 0.1, 0.2]
      - value: 0.2
      density: 0.65
      lambda: 1.05
  - model: TareksLab/L2-MERGE3
    parameters:
      weight: 
      - filter: self_attn
        value: [0.1, 0.3, 0.1]
      - filter: mlp
        value: [0.2, 0.3, 0.1]
      - value: 0.2
      density: 0.6
      lambda: 1.05
  - model: TareksLab/L2-MERGE1
    parameters:
      weight: 
      - filter: self_attn
        value: [0.2, 0.2, 0.1]
      - filter: mlp
        value: [0.1, 0.2, 0.2]
      - value: 0.2
      density: 0.6
      lambda: 1
  - model: TareksLab/L-BASE-V1
    parameters:
      weight: 
      - filter: self_attn
        value: [0.1, 0.3, 0.3]
      - filter: mlp
        value: [0.1, 0.2, 0.4]
      - value: 0.2
      density: 0.55
      lambda: 1
base_model: TareksLab/L-BASE-V1
merge_method: dare_ties
parameters:
  normalize: false
  pad_to_multiple_of: 4
tokenizer:
  source: base
chat_template: llama3
dtype: bfloat16

モデル情報

属性	詳細
ベースモデル	TareksLab/L2-MERGE2a、TareksLab/L2-MERGE4、TareksLab/L-BASE-V1、TareksLab/L2-MERGE3、TareksLab/L2-MERGE1
ライブラリ名	transformers
タグ	mergekit、merge