Supermario-v2開源文本生成模型 - 免費使用，基於多模型合併能力強

首頁

Supermario V2

由jan-hq開發

supermario-v2是一個基於Mistral-7B-v0.1的合併模型，使用了DARE_TIES方法合併了三個不同的模型，具備較強的文本生成能力。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #多任務文本生成 #高推理準確率 #少量樣本適配

下載量 77

發布時間 : 12/11/2023

模型概述

該模型通過合併OpenHermes-2.5-neural-chat-v3-3-Slerp、MetaMath-Cybertron-Starling和Marcoroni-7B-v3三個模型，提升了在多個文本生成任務上的表現。

模型特點

多模型合併

使用DARE_TIES方法合併了三個高性能模型，綜合了各自的優勢。

高性能文本生成

在多個文本生成任務上表現出色，如ARC挑戰賽、HellaSwag等。

開源免費

模型完全開源且免費，支持本地運行，保障數據隱私。

模型能力

文本生成

推理任務

問答系統

數學問題解答

使用案例

教育

數學問題解答

解答GSM8k數據集中的數學問題

準確率達到72.18%

通用問答

常識推理

回答HellaSwag數據集中的常識問題

準確率達到86.51%

🚀 超級馬里奧-v2（Supermario-v2）

超級馬里奧-v2是一個文本生成模型，它通過特定的合併方法融合了多個優秀模型的特性，在多個文本生成任務的數據集上展現出了良好的性能，為用戶提供了強大且可靠的文本生成能力。

🚀 快速開始

你可以使用 Jan Desktop 在 Mac、Windows 或 Linux 系統上運行此模型。

Jan 是一個開源的、可替代 ChatGPT 的工具，具備以下特性：

💻 完全離線運行：你的對話內容保持私密，僅你可見。
🗂️ 開放文件格式：對話和模型設置保存在你的電腦上，可隨時導出或刪除。
🌐 兼容 OpenAI：在端口 1337 上提供兼容 OpenAI 的本地服務器端點。
🌍 開源且免費：我們公開開發過程，查看我們的 Github。

image/png

✨ 主要特性

多模型融合：該模型使用 DARE_TIES 合併方法，融合了 OpenHermes-2.5-neural-chat-v3-3-Slerp、MetaMath-Cybertron-Starling 和 Marcoroni-7B-v3 三個模型的優勢，以 Mistral-7B-v0.1 為基礎模型。
多任務表現良好：在多個文本生成任務的數據集上進行了評估，如 AI2 Reasoning Challenge、HellaSwag、MMLU 等，均取得了不錯的成績。

📦 安裝指南

暫未提供相關安裝步驟。

💻 使用示例

提示模板

ChatML

<|im_start|>system
{system_message}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

System

### System:
{system}
### User:
{user}
### Assistant:

📚 詳細文檔

模型描述

此模型使用 DARE_TIES 合併方法，從以下 3 個模型合併而來：

基礎模型：Mistral-7B-v0.1

該模型的 yaml 配置文件如下：

base_model: mistralai/Mistral-7B-v0.1
dtype: bfloat16
merge_method: dare_ties
models:
- model: mistralai/Mistral-7B-v0.1
- model: Weyaxi/OpenHermes-2.5-neural-chat-v3-3-Slerp
  parameters:
    density: 0.8
    weight: 0.4
- model: Q-bert/MetaMath-Cybertron-Starling
  parameters:
    density: 0.8
    weight: 0.3
- model: AIDC-ai-business/Marcoroni-7B-v3
  parameters:
    density: 0.8
    weight: 0.3
parameters:
  int8_mask: true

關於 Jan

Jan 堅信需要一個開源的 AI 生態系統，並正在構建基礎設施和工具，以使開源 AI 能夠與專有 AI 在公平的競爭環境中競爭。

Jan 的長期願景是為未來的機器人構建一個認知框架，這些機器人將成為人類和企業日常生活中實用、有用的助手。

Jan 模型合併器

這是一個用於合併模型的測試項目。

開放大語言模型排行榜評估結果

詳細結果可查看此處。

指標	值
平均值	72.34
AI2 推理挑戰（25 次少樣本）	68.52
HellaSwag（10 次少樣本）	86.51
MMLU（5 次少樣本）	64.88
TruthfulQA（0 次少樣本）	60.58
Winogrande（5 次少樣本）	81.37
GSM8k（5 次少樣本）	72.18