orthogonal-2x7B-v2-base開源文本生成模型 - 免費部署助力多樣文本創作

首頁

Orthogonal 2x7B V2 Base

由LoSboccacc開發

orthogonal-2x7B-v2-base 是一個基於 Mistral-7B-Instruct-v0.2 和 SanjiWatsuki/Kunoichi-DPO-v2-7B 的混合專家模型，專注於文本生成任務。

大型語言模型

Transformers

#多任務推理 #少量樣本學習 #角色扮演優化

下載量 80

發布時間 : 1/18/2024

模型概述

該模型結合了兩個專家模型的能力，分別擅長角色扮演和聊天任務，通過門控機制動態選擇最合適的專家模型進行文本生成。

模型特點

混合專家架構

結合兩個7B參數模型的能力，通過門控機制動態選擇最適合的專家模型。

多任務優化

針對不同任務（如角色扮演和聊天）使用專門的專家模型，提高生成質量。

高效推理

相比單一大型模型，混合專家架構可以在保持性能的同時提高推理效率。

模型能力

文本生成

對話系統

角色扮演

問答系統

推理任務

使用案例

對話系統

智能聊天助手

用於構建自然流暢的對話系統

在HellaSwag數據集上達到85.69%的準確率

教育

科學問答系統

回答科學相關的問題

在AI2推理挑戰賽上達到66.89%的準確率

數學推理

數學問題解答

解決基礎數學問題

在GSM8k數據集上達到51.4%的準確率

🚀 orthogonal-2x7B-v2-base

orthogonal-2x7B-v2-base是一個基於特定模型架構的文本生成模型，在多個文本生成任務的數據集上進行了評估，並在Open LLM Leaderboard上展示了其性能。

📚 詳細文檔

模型信息

屬性	詳情
基礎模型	mistralai/Mistral-7B-Instruct-v0.2
門控模式	hidden（可選值："hidden", "cheap_embed", 或 "random"）
數據類型	bfloat16（輸出數據類型，可選值：float32, float16, 或 bfloat16）

專家模型信息

專家模型	正向提示詞
SanjiWatsuki/Kunoichi-DPO-v2-7B	"roleplay"
mistralai/Mistral-7B-Instruct-v0.2	"chat"

評估結果

詳細任務評估

AI2 Reasoning Challenge (25-Shot)
- 任務類型：文本生成
- 數據集類型：ai2_arc
- 數據集配置：ARC-Challenge
- 數據集分割：測試集
- 少樣本數量：25
- 評估指標：歸一化準確率（acc_norm），值為 66.89
- 來源：Open LLM Leaderboard
HellaSwag (10-Shot)
- 任務類型：文本生成
- 數據集類型：hellaswag
- 數據集分割：驗證集
- 少樣本數量：10
- 評估指標：歸一化準確率（acc_norm），值為 85.69
- 來源：Open LLM Leaderboard
MMLU (5-Shot)
- 任務類型：文本生成
- 數據集類型：cais/mmlu
- 數據集配置：all
- 數據集分割：測試集
- 少樣本數量：5
- 評估指標：準確率（acc），值為 62.65
- 來源：Open LLM Leaderboard
TruthfulQA (0-shot)
- 任務類型：文本生成
- 數據集類型：truthful_qa
- 數據集配置：multiple_choice
- 數據集分割：驗證集
- 少樣本數量：0
- 評估指標：mc2，值為 66.8
- 來源：Open LLM Leaderboard
Winogrande (5-shot)
- 任務類型：文本生成
- 數據集類型：winogrande
- 數據集配置：winogrande_xl
- 數據集分割：驗證集
- 少樣本數量：5
- 評估指標：準確率（acc），值為 77.35
- 來源：Open LLM Leaderboard
GSM8k (5-shot)
- 任務類型：文本生成
- 數據集類型：gsm8k
- 數據集配置：main
- 數據集分割：測試集
- 少樣本數量：5
- 評估指標：準確率（acc），值為 51.4
- 來源：Open LLM Leaderboard

綜合評估指標

指標	值
平均值	68.47
AI2 Reasoning Challenge (25-Shot)	66.89
HellaSwag (10-Shot)	85.69
MMLU (5-Shot)	62.65
TruthfulQA (0-shot)	66.80
Winogrande (5-shot)	77.35
GSM8k (5-shot)	51.40