supermario-slerp-v2开源文本生成模型 - 由SLERP合并，多基准测试表现出色

Home

Supermario Slerp V2

Developed by jan-hq

supermario-slerp-v2 是一个通过 SLERP 方法合并两个 7B 参数模型而成的文本生成模型，在多个基准测试中表现出色。

大型语言模型

Transformers

EnglishOpen Source License:Apache-2.0 #多任务文本生成 #高准确率推理 #知识密集型问答

Downloads 15

Release Time : 12/12/2023

Model Overview

该模型是通过 SLERP 方法合并 v1olet_marcoroni-go-bruins-merge-7B 和 juanako-7b-UNA 两个模型而成，主要用于文本生成任务。

Model Features

模型合并技术

使用 SLERP 方法合并两个不同模型，结合各自的优势

高性能

在多个基准测试中表现优异，如 HellaSwag 达到 86.6 的标准化准确率

开源可用

采用 Apache 2.0 许可证，可自由使用和修改

Model Capabilities

文本生成

问答系统

推理任务

Use Cases

教育

AI2推理挑战赛

用于解决复杂的推理问题

标准化准确率 69.37

常识推理

HellaSwag测试

评估模型的常识推理能力

标准化准确率 86.6

数学问题解决

GSM8k数学测试

解决小学数学问题

准确率 63.46

🚀 超级马里奥Slerp V2模型

本项目的超级马里奥Slerp V2模型专注于文本生成任务，通过独特的模型融合方法，在多个权威数据集上展现出了优秀的性能，为文本生成领域提供了新的解决方案。

🚀 快速开始

你可以使用 Jan Desktop 在 Mac、Windows 或 Linux 系统上运行此模型。Jan 是一个开源的 ChatGPT 替代方案，具有以下特点：

💻 100% 本地离线运行：你的对话内容保持机密，只有你能看到。
🗂️ 开放文件格式：对话和模型设置保存在你的计算机上，可以随时导出或删除。
🌐 与 OpenAI 兼容：本地服务器端口为 1337，具有与 OpenAI 兼容的端点。
🌍 开源且免费：我们公开开发，查看我们的 Github。

image/png

✨ 主要特性

模型融合：该模型使用 Slerp 融合方法，融合了两个模型：
1. v1olet_marcoroni-go-bruins-merge-7B
2. juanako-7b-UNA
基础模型：以 v1olet_marcoroni-go-bruins-merge-7B 为基础模型。

📚 详细文档

模型描述

此模型使用 Slerp 融合方法从两个模型融合而来：

基础模型：v1olet_marcoroni-go-bruins-merge-7B

该模型的 yaml 配置文件如下：

slices:
  - sources:
      - model: v1olet/v1olet_marcoroni-go-bruins-merge-7B
        layer_range: [0, 32]
      - model: fblgit/juanako-7b-UNA
        layer_range: [0, 32]
merge_method: slerp
base_model: v1olet/v1olet_marcoroni-go-bruins-merge-7B
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.5
dtype: bfloat16

评估结果

详细结果可查看 Open LLM Leaderboard Evaluation Results。

指标	值
平均值	71.35
AI2 推理挑战 (25 次少样本学习)	69.37
HellaSwag (10 次少样本学习)	86.60
MMLU (5 次少样本学习)	64.91
TruthfulQA (0 次少样本学习)	62.96
Winogrande (5 次少样本学习)	80.82
GSM8k (5 次少样本学习)	63.46