Kunoichi-DPO-v2-7B開源大語言模型 - 多項測試表現佳，助力多樣文本應用

Kunoichi DPO V2 7B

由SanjiWatsuki開發

Kunoichi-DPO-v2-7B是基於Mistral架構的7B參數大語言模型，採用DPO（Direct Preference Optimization）優化訓練，在多項基準測試中表現優異。

下載量 185

發布時間 : 1/13/2024

模型概述

該模型是一個經過優化的對話型語言模型，專注於提供高質量的文本生成和理解能力，適用於多種自然語言處理任務。

DPO優化訓練

採用Direct Preference Optimization方法進行優化訓練，提高了模型的對話質量和一致性

高性能

在MT Bench、EQ Bench等多個基準測試中表現優異，超越同類7B參數模型

多功能性

支持多種自然語言處理任務，包括文本生成、問答和對話系統

文本生成

對話系統

問答系統

邏輯推理

知識問答

智能助手

虛擬客服

用於客戶服務場景的自動問答系統

能夠提供準確、連貫的客服響應

教育

學習輔導

幫助學生解答學習問題

在MMLU等知識測試中表現良好

本項目主要展示了Kunoichi系列模型與其他知名大語言模型在多個評測基準上的性能對比，為模型的選擇和研究提供了有價值的參考。

本項目採用CC BY-NC 4.0許可協議。

模型	MT Bench	EQ Bench	MMLU	Logic Test
GPT-4-Turbo	9.32	-	-	-
GPT-4	8.99	62.52	86.4	0.86
Kunoichi-DPO-v2-7B	8.51	42.18	64.94	0.58
Mixtral-8x7B-Instruct	8.30	44.81	70.6	0.75
Kunoichi-DPO-7B	8.29	41.60	64.83	0.59
Kunoichi-7B	8.14	44.32	64.9	0.58
Starling-7B	8.09	-	63.9	0.51
Claude-2	8.06	52.14	78.5	-
Silicon-Maid-7B	7.96	40.44	64.7	0.54
Loyal-Macaroni-Maid-7B	7.95	38.66	64.9	0.57
GPT-3.5-Turbo	7.94	50.28	70	0.57
Claude-1	7.9	-	77	-
Openchat-3.5	7.81	37.08	64.3	0.39
Dolphin-2.6-DPO	7.74	42.88	61.9	0.53
Zephyr-7B-beta	7.34	38.71	61.4	0.30
Llama-2-70b-chat-hf	6.86	51.56	63	-
Neural-chat-7b-v3-1	6.84	43.61	62.4	0.30

模型	平均得分	AGIEval	GPT4All	TruthfulQA	Bigbench
Kunoichi-DPO-7B	58.4	45.08	74	66.99	47.52
Kunoichi-DPO-v2-7B	58.31	44.85	75.05	65.69	47.65
Kunoichi-7B	57.54	44.99	74.86	63.72	46.58
OpenPipe/mistral-ft-optimized-1218	56.85	44.74	75.6	59.89	47.17
Silicon-Maid-7B	56.45	44.74	74.26	61.5	45.32
mlabonne/NeuralHermes-2.5-Mistral-7B	53.51	43.67	73.24	55.37	41.76
teknium/OpenHermes-2.5-Mistral-7B	52.42	42.75	72.99	52.99	40.94
openchat/openchat_3.5	51.34	42.67	72.92	47.27	42.51
berkeley-nest/Starling-LM-7B-alpha	51.16	42.06	72.72	47.33	42.53
HuggingFaceH4/zephyr-7b-beta	50.99	37.33	71.83	55.1	39.7