Aurora - Borealis - LLaMa - 70B开源多模型融合项目，带来多版本模型融合新体验

首页

Aurora Borealis LLaMa 70B

由 Tarek07 开发

这是一个基于LLaMa-70B架构的多模型融合实验项目，采用DARE TIES融合方法，结合了6个不同版本的MO-MODEL模型。

大型语言模型

Transformers

#多模型融合 #DARE TIES技术 #70B参数量

下载量 112

发布时间 : 5/1/2025

模型简介

专业模型融合实验的成果，尝试使用梯度技术精细控制各模型对最终融合结果的影响，适用于高级自然语言处理任务。

模型特点

多模型融合

融合了6个不同版本的70B参数模型，通过DARE TIES方法实现精细控制

梯度技术应用

在融合过程中尝试使用梯度技术，优化各模型对最终结果的贡献

高精度要求

建议不要在低于Q5量化的配置上运行，保证模型性能

模型能力

文本生成

语言理解

复杂推理

使用案例

研究与开发

模型融合技术研究

用于研究多模型融合方法和效果评估

提供不同权重配置下的融合效果对比

自然语言处理

高级文本生成

生成高质量、连贯的长文本内容

🚀 MERGE2

MERGE2是使用mergekit创建的预训练语言模型的融合模型，本项目持续进行专业模型融合实验，为最终融合提供更精细的控制。

🚀 快速开始

该模型曾被称为MO - MODEL - Fused - V0.6 - LLaMa - 70B，是一系列专业模型融合实验的成果。此次实验引入了梯度控制，以便对最终融合模型进行更精细的调整。

✨ 主要特性

采用DARE TIES融合方法，以[TareksLab/MO - MODEL6 - V0.1 - LLaMa - 70B](https://huggingface.co/TareksLab/MO - MODEL6 - V0.1 - LLaMa - 70B)为基础进行融合。
融合了多个预训练语言模型，包括[TareksLab/MO - MODEL3 - V0.2 - LLaMa - 70B](https://huggingface.co/TareksLab/MO - MODEL3 - V0.2 - LLaMa - 70B)等。
通过梯度控制，实现对最终融合模型的精细调整。

📚 详细文档

融合详情

融合方法

此模型使用DARE TIES融合方法，以[TareksLab/MO - MODEL6 - V0.1 - LLaMa - 70B](https://huggingface.co/TareksLab/MO - MODEL6 - V0.1 - LLaMa - 70B)为基础进行融合。

融合的模型

以下模型参与了融合：

[TareksLab/MO - MODEL3 - V0.2 - LLaMa - 70B](https://huggingface.co/TareksLab/MO - MODEL3 - V0.2 - LLaMa - 70B)
[TareksLab/MO - MODEL5 - V0.3 - LLaMa - 70B](https://huggingface.co/TareksLab/MO - MODEL5 - V0.3 - LLaMa - 70B)
[TareksLab/MO - MODEL2 - V0.2 - LLaMa - 70B](https://huggingface.co/TareksLab/MO - MODEL2 - V0.2 - LLaMa - 70B)
[TareksLab/MO - MODEL1 - V1 - LLaMa - 70B](https://huggingface.co/TareksLab/MO - MODEL1 - V1 - LLaMa - 70B)
[TareksLab/MO - MODEL4 - V0.1 - LLaMa - 70B](https://huggingface.co/TareksLab/MO - MODEL4 - V0.1 - LLaMa - 70B)

配置

以下YAML配置用于生成此模型：

models:
  - model: TareksLab/MO-MODEL6-V0.1-LLaMa-70B
    parameters:
      weight: [0.1, 0.1, 0.1, 0.2, 0.5]
      density: 0.5
  - model: TareksLab/MO-MODEL4-V0.1-LLaMa-70B
    parameters:
      weight: [0.1, 0.1, 0.2, 0.4, 0.2]
      density: 0.5
  - model: TareksLab/MO-MODEL5-V0.3-LLaMa-70B
    parameters:
      weight: [0.1, 0.2, 0.4, 0.2, 0.1]
      density: 0.5
  - model: TareksLab/MO-MODEL3-V0.2-LLaMa-70B
    parameters:
      weight: [0.2, 0.4, 0.2, 0.1, 0.1]
      density: 0.5
  - model: TareksLab/MO-MODEL2-V0.2-LLaMa-70B
    parameters:
      weight: [0.5, 0.2, 0.1, 0.1, 0.1]
      density: 0.5
  - model: TareksLab/MO-MODEL1-V1-LLaMa-70B
    parameters:
      weight: 0.10
      density: 0.5
merge_method: dare_ties
base_model: TareksLab/MO-MODEL6-V0.1-LLaMa-70B
parameters:
  normalize: false
  int8_mask: true
dtype: float32
out_dtype: bfloat16
chat_template: llama3
tokenizer:
 source: base