首页

Chupacabra 7B V2

由 perlthoughts 开发

基于Mistral架构的7B参数大语言模型，采用SLERP融合技术合并多个高性能模型权重

大型语言模型

Transformers

开源协议:Apache-2.0 #SLERP融合模型 #多任务文本生成 #高精度推理

下载量 99

发布时间 : 11/21/2023

模型简介

该模型通过先进的SLERP融合技术整合多个基于Mistral的模型，在文本生成任务中表现优异，支持多种自然语言处理任务

模型特点

SLERP融合技术

采用球面线性插值(SLERP)而非传统权重平均，能更好地保留双亲模型特征

高性能训练

整合了采用DPO、SFT和强化学习等先进训练方法的模型权重

多任务优化

在ARC、HellaSwag、MMLU等多个基准测试中表现优异

模型能力

文本生成

问答系统

推理任务

常识理解

使用案例

教育

学术问答

回答各类学科知识问题

在MMLU测试中准确率达63.6%

研究

推理挑战

解决复杂的推理问题

在AI2推理挑战赛中标准化准确率65.19%

🚀 Chupacabra 7B v2

Chupacabra 7B v2 是一个基于Mistral模型融合而成的文本生成模型，采用了先进的SLERP融合方法，能有效结合多个模型的优势，在多个文本生成任务中展现出良好的性能。

🚀 快速开始

使用以下代码可开始使用该模型：

# 此处应补充具体的代码示例，文档中未提供，需根据实际情况添加

✨ 主要特性

先进的融合方法：采用SLERP（Spherical Linear Interpolation）融合方法，相较于常见的权重平均法，能确保生成的模型平滑地融合两个父模型的特征，在高维空间中更好地保留模型的曲率和特性，实现更细致的融合。
多任务表现良好：在多个文本生成任务中，如AI2推理挑战、HellaSwag、MMLU等，都取得了不错的成绩。

📦 安装指南

文档未提供具体安装步骤，暂无法展示。

💻 使用示例

基础用法

替换 {system} 为你的系统提示，{prompt} 为你的提示指令。

<|im_start|>system
{system}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

📚 详细文档

模型描述

该模型通过SLERP融合方法，基于Mistral模型进行融合。SLERP方法具有以下优势：

平滑过渡：确保模型参数之间的过渡更加平滑，在高维向量插值时尤为重要。
特性保留：与权重平均法不同，SLERP能在高维空间中保留两个模型的曲率和特性，避免稀释独特特征。
细致融合：考虑了向量空间中模型的几何和旋转特性，使融合结果更能反映两个父模型的特征。

目的

通过直接偏好优化（DPO）、监督微调（SFT）和强化学习等先进训练方法，融合Mistral模型中性能最佳的模型权重。

错误修复

修复了生成问题和模型权重错误的问题，已更正模型权重，现在生成功能恢复正常。同时将GGUF版本重新上传到GGUF仓库，以及AWQ版本。
修复了分词器停止不正确的问题，并更改了提示模板。
上传了新的融合模型权重。

属性	详情
开发人员	Ray Hernandez
模型类型	Mistral
语言（NLP）	英语
许可证	Apache 2.0

🔧 技术细节

文档未提供具体技术实现细节，暂无法展示。

📄 许可证

本模型使用Apache 2.0许可证。

Open LLM Leaderboard评估结果

详细结果可查看此处

指标	值
平均值	67.04
AI2推理挑战（25次-shot）	65.19
HellaSwag（10次-shot）	83.39
MMLU（5次-shot）	63.60
TruthfulQA（0次-shot）	57.17
Winogrande（5次-shot）	78.14
GSM8k（5次-shot）	54.74