supermario-slerp-v2開源文本生成模型 - 由SLERP合併，多基準測試表現出色

首頁

Supermario Slerp V2

由jan-hq開發

supermario-slerp-v2 是一個通過 SLERP 方法合併兩個 7B 參數模型而成的文本生成模型，在多個基準測試中表現出色。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #多任務文本生成 #高準確率推理 #知識密集型問答

下載量 15

發布時間 : 12/12/2023

模型概述

該模型是通過 SLERP 方法合併 v1olet_marcoroni-go-bruins-merge-7B 和 juanako-7b-UNA 兩個模型而成，主要用於文本生成任務。

模型特點

模型合併技術

使用 SLERP 方法合併兩個不同模型，結合各自的優勢

高性能

在多個基準測試中表現優異，如 HellaSwag 達到 86.6 的標準化準確率

開源可用

採用 Apache 2.0 許可證，可自由使用和修改

模型能力

文本生成

問答系統

推理任務

使用案例

教育

AI2推理挑戰賽

用於解決複雜的推理問題

標準化準確率 69.37

常識推理

HellaSwag測試

評估模型的常識推理能力

標準化準確率 86.6

數學問題解決

GSM8k數學測試

解決小學數學問題

準確率 63.46

🚀 超級馬里奧Slerp V2模型

本項目的超級馬里奧Slerp V2模型專注於文本生成任務，通過獨特的模型融合方法，在多個權威數據集上展現出了優秀的性能，為文本生成領域提供了新的解決方案。

🚀 快速開始

你可以使用 Jan Desktop 在 Mac、Windows 或 Linux 系統上運行此模型。Jan 是一個開源的 ChatGPT 替代方案，具有以下特點：

💻 100% 本地離線運行：你的對話內容保持機密，只有你能看到。
🗂️ 開放文件格式：對話和模型設置保存在你的計算機上，可以隨時導出或刪除。
🌐 與 OpenAI 兼容：本地服務器端口為 1337，具有與 OpenAI 兼容的端點。
🌍 開源且免費：我們公開開發，查看我們的 Github。

image/png

✨ 主要特性

模型融合：該模型使用 Slerp 融合方法，融合了兩個模型：
1. v1olet_marcoroni-go-bruins-merge-7B
2. juanako-7b-UNA
基礎模型：以 v1olet_marcoroni-go-bruins-merge-7B 為基礎模型。

📚 詳細文檔

模型描述

此模型使用 Slerp 融合方法從兩個模型融合而來：

基礎模型：v1olet_marcoroni-go-bruins-merge-7B

該模型的 yaml 配置文件如下：

slices:
  - sources:
      - model: v1olet/v1olet_marcoroni-go-bruins-merge-7B
        layer_range: [0, 32]
      - model: fblgit/juanako-7b-UNA
        layer_range: [0, 32]
merge_method: slerp
base_model: v1olet/v1olet_marcoroni-go-bruins-merge-7B
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.5
dtype: bfloat16

評估結果

詳細結果可查看 Open LLM Leaderboard Evaluation Results。

指標	值
平均值	71.35
AI2 推理挑戰 (25 次少樣本學習)	69.37
HellaSwag (10 次少樣本學習)	86.60
MMLU (5 次少樣本學習)	64.91
TruthfulQA (0 次少樣本學習)	62.96
Winogrande (5 次少樣本學習)	80.82
GSM8k (5 次少樣本學習)	63.46