MN-Nyx-Chthonia-12B开源语言模型 - 融合7模型提升综合应用能力

首页

MN Nyx Chthonia 12B

由 mergekit-community 开发

这是一个基于多个12B参数规模模型的合并版本，采用model_stock方法融合了7个不同特性的预训练语言模型，以增强综合能力。

大型语言模型

Transformers

#多模型融合 #指令微调优化 #心理学推理增强

下载量 31

发布时间 : 4/25/2025

模型简介

该模型通过合并多个专业领域的12B参数模型，旨在提升在推理、创作和心理分析等任务上的表现，特别优化了指令跟随能力。

模型特点

多模型知识融合

整合了Gutenberg文学、心理学推理、创意写作等不同专业领域的模型优势

指令优化

以Mistral-Nemo-Instruct为基础模型，强化了指令理解和执行能力

加权融合策略

对关键组件模型（如EtherealAurora和推理LoRA）采用差异化权重配置

模型能力

长文本生成

多轮对话

逻辑推理

创意写作

心理分析

指令理解

使用案例

创意辅助

故事创作

生成具有文学性的长篇幅叙事文本

结合Gutenberg和Lyra模型的文学风格

专业分析

心理评估

分析文本中的心理特征和认知模式

整合了专业心理学推理LoRA的能力

🚀 预训练语言模型合并项目

本项目是使用 mergekit 对预训练语言模型进行合并的成果。通过合并多个预训练模型，旨在提升模型的性能和适用性，为自然语言处理任务提供更强大的支持。

基础模型信息

属性	详情
基础模型	DavidAU/MN - GRAND - Gutenberg - Lyra4 - Lyra - 12B - DARKNESS、mistralai/Mistral - Nemo - Base - 2407、mistralai/Mistral - Nemo - Instruct - 2407、redrix/sororicide - 12B - Farer - Mell - Unslop、mergekit - community/MN - Chthonia - 12B、yamatazen/EtherealAurora - 12B - v2、mergekit - community/MN - Anathema - 12B、mergekit - community/MN - Ephemeros - 12B、jtatman/mistral_nemo_12b_reasoning_psychology_lora
库名称	transformers
标签	mergekit、merge

🚀 合并详情

合并方法

本模型采用 Model Stock 合并方法，以 [mistralai/Mistral - Nemo - Instruct - 2407](https://huggingface.co/mistralai/Mistral - Nemo - Instruct - 2407) 为基础进行合并。

参与合并的模型

以下模型参与了本次合并：

[DavidAU/MN - GRAND - Gutenberg - Lyra4 - Lyra - 12B - DARKNESS](https://huggingface.co/DavidAU/MN - GRAND - Gutenberg - Lyra4 - Lyra - 12B - DARKNESS)
[mistralai/Mistral - Nemo - Base - 2407](https://huggingface.co/mistralai/Mistral - Nemo - Base - 2407)
[redrix/sororicide - 12B - Farer - Mell - Unslop](https://huggingface.co/redrix/sororicide - 12B - Farer - Mell - Unslop)
[mergekit - community/MN - Chthonia - 12B](https://huggingface.co/mergekit - community/MN - Chthonia - 12B)
[yamatazen/EtherealAurora - 12B - v2](https://huggingface.co/yamatazen/EtherealAurora - 12B - v2)
[mergekit - community/MN - Anathema - 12B](https://huggingface.co/mergekit - community/MN - Anathema - 12B)
[mergekit - community/MN - Ephemeros - 12B](https://huggingface.co/mergekit - community/MN - Ephemeros - 12B) + jtatman/mistral_nemo_12b_reasoning_psychology_lora

配置信息

以下是用于生成此模型的 YAML 配置：

dtype: float32
out_dtype: bfloat16
merge_method: model_stock
base_model: mistralai/Mistral-Nemo-Instruct-2407
models:
  - model: DavidAU/MN-GRAND-Gutenberg-Lyra4-Lyra-12B-DARKNESS
  - model: mergekit-community/MN-Anathema-12B
  - model: mergekit-community/MN-Chthonia-12B
  - model: mergekit-community/MN-Ephemeros-12B+jtatman/mistral_nemo_12b_reasoning_psychology_lora
    parameters:
      weight: 0.7
  - model: mistralai/Mistral-Nemo-Base-2407
    parameters:
      weight: 0.5
  - model: redrix/sororicide-12B-Farer-Mell-Unslop
  - model: yamatazen/EtherealAurora-12B-v2
    parameters:
      weight: 1.4

tokenizer:
  source: union
  tokens:
    "<|im_start|>":
      source: yamatazen/EtherealAurora-12B-v2
    "<|im_end|>":
      source: yamatazen/EtherealAurora-12B-v2
    "[INST]":
      source: mistralai/Mistral-Nemo-Instruct-2407
    "[/INST]":
      source: mistralai/Mistral-Nemo-Instruct-2407
      
chat_template: chatml