🚀 [SanjiWatsuki/Kunoichi-DPO-v2-7B]的GGUF-Imatrix量化
本項目提供了SanjiWatsuki/Kunoichi-DPO-v2-7B模型的GGUF-Imatrix量化版本。通過使用Importance Matrix技術,提升了量化模型的質量,減少了模型性能的損失。
🚀 快速開始
本項目使用 llama.cpp-b2277 進行處理,對於 --imatrix 數據,使用了 imatrix-Kunoichi-DPO-v2-7B-F16.dat
。
✨ 主要特性
“Imatrix” 含義
“Imatrix” 代表 Importance Matrix,這是一種用於提高量化模型質量的技術。Imatrix 基於校準數據計算得出,它有助於在量化過程中確定不同模型激活的重要性。其核心思想是在量化過程中保留最重要的信息,從而減少模型性能的損失。使用 Imatrix 的好處之一是可以提高模型性能,特別是在校準數據多樣化的情況下。
更多信息可參考:[1] [2]
量化流程
Base⇢ GGUF(F16)⇢ Imatrix-Data(F16)⇢ GGUF(Imatrix-Quants)
支持說明
⚠️ 重要提示
最近我的上傳速度很慢且不穩定,實際上我需要更換網絡服務提供商來改善這種情況。如果您願意並且有能力支持我的工作,可以通過這裡(Ko-fi)支持我。對於給您帶來的不便,我深表歉意。
📚 詳細文檔
原模型信息
模型性能對比表1
模型 |
MT Bench |
EQ Bench |
MMLU |
Logic Test |
GPT-4-Turbo |
9.32 |
- |
- |
- |
GPT-4 |
8.99 |
62.52 |
86.4 |
0.86 |
Kunoichi-DPO-v2-7B |
8.51 |
42.18 |
64.94 |
0.58 |
Mixtral-8x7B-Instruct |
8.30 |
44.81 |
70.6 |
0.75 |
Kunoichi-DPO-7B |
8.29 |
41.60 |
64.83 |
0.59 |
Kunoichi-7B |
8.14 |
44.32 |
64.9 |
0.58 |
Starling-7B |
8.09 |
- |
63.9 |
0.51 |
Claude-2 |
8.06 |
52.14 |
78.5 |
- |
Silicon-Maid-7B |
7.96 |
40.44 |
64.7 |
0.54 |
Loyal-Macaroni-Maid-7B |
7.95 |
38.66 |
64.9 |
0.57 |
GPT-3.5-Turbo |
7.94 |
50.28 |
70 |
0.57 |
Claude-1 |
7.9 |
- |
77 |
- |
Openchat-3.5 |
7.81 |
37.08 |
64.3 |
0.39 |
Dolphin-2.6-DPO |
7.74 |
42.88 |
61.9 |
0.53 |
Zephyr-7B-beta |
7.34 |
38.71 |
61.4 |
0.30 |
Llama-2-70b-chat-hf |
6.86 |
51.56 |
63 |
- |
Neural-chat-7b-v3-1 |
6.84 |
43.61 |
62.4 |
0.30 |
模型性能對比表2
模型性能對比表3
模型 |
AlpacaEval2 |
Length |
GPT-4 |
23.58% |
1365 |
GPT-4 0314 |
22.07% |
1371 |
Mistral Medium |
21.86% |
1500 |
Mixtral 8x7B v0.1 |
18.26% |
1465 |
Kunoichi-DPO-v2 |
17.19% |
1785 |
Claude 2 |
17.19% |
1069 |
Claude |
16.99% |
1082 |
Gemini Pro |
16.85% |
1315 |
GPT-4 0613 |
15.76% |
1140 |
Claude 2.1 |
15.73% |
1096 |
Mistral 7B v0.2 |
14.72% |
1676 |
GPT 3.5 Turbo 0613 |
14.13% |
1328 |
LLaMA2 Chat 70B |
13.87% |
1790 |
LMCocktail-10.7B-v1 |
13.15% |
1203 |
WizardLM 13B V1.1 |
11.23% |
1525 |
Zephyr 7B Beta |
10.99% |
1444 |
OpenHermes-2.5-Mistral (7B) |
10.34% |
1107 |
GPT 3.5 Turbo 0301 |
9.62% |
827 |
Kunoichi-7B |
9.38% |
1492 |
GPT 3.5 Turbo 1106 |
9.18% |
796 |
GPT-3.5 |
8.56% |
1018 |
Phi-2 DPO |
7.76% |
1687 |
LLaMA2 Chat 13B |
7.70% |
1513 |
萌妹卡片

📄 許可證
本項目採用 cc-by-nc-4.0
許可證。所有版權歸原作者所有。
如果您希望添加特定的量化,請隨時提出。