🚀 [SanjiWatsuki/Kunoichi-DPO-v2-7B]的GGUF-Imatrix量化
本项目提供了SanjiWatsuki/Kunoichi-DPO-v2-7B模型的GGUF-Imatrix量化版本。通过使用Importance Matrix技术,提升了量化模型的质量,减少了模型性能的损失。
🚀 快速开始
本项目使用 llama.cpp-b2277 进行处理,对于 --imatrix 数据,使用了 imatrix-Kunoichi-DPO-v2-7B-F16.dat
。
✨ 主要特性
“Imatrix” 含义
“Imatrix” 代表 Importance Matrix,这是一种用于提高量化模型质量的技术。Imatrix 基于校准数据计算得出,它有助于在量化过程中确定不同模型激活的重要性。其核心思想是在量化过程中保留最重要的信息,从而减少模型性能的损失。使用 Imatrix 的好处之一是可以提高模型性能,特别是在校准数据多样化的情况下。
更多信息可参考:[1] [2]
量化流程
Base⇢ GGUF(F16)⇢ Imatrix-Data(F16)⇢ GGUF(Imatrix-Quants)
支持说明
⚠️ 重要提示
最近我的上传速度很慢且不稳定,实际上我需要更换网络服务提供商来改善这种情况。如果您愿意并且有能力支持我的工作,可以通过这里(Ko-fi)支持我。对于给您带来的不便,我深表歉意。
📚 详细文档
原模型信息
模型性能对比表1
模型 |
MT Bench |
EQ Bench |
MMLU |
Logic Test |
GPT-4-Turbo |
9.32 |
- |
- |
- |
GPT-4 |
8.99 |
62.52 |
86.4 |
0.86 |
Kunoichi-DPO-v2-7B |
8.51 |
42.18 |
64.94 |
0.58 |
Mixtral-8x7B-Instruct |
8.30 |
44.81 |
70.6 |
0.75 |
Kunoichi-DPO-7B |
8.29 |
41.60 |
64.83 |
0.59 |
Kunoichi-7B |
8.14 |
44.32 |
64.9 |
0.58 |
Starling-7B |
8.09 |
- |
63.9 |
0.51 |
Claude-2 |
8.06 |
52.14 |
78.5 |
- |
Silicon-Maid-7B |
7.96 |
40.44 |
64.7 |
0.54 |
Loyal-Macaroni-Maid-7B |
7.95 |
38.66 |
64.9 |
0.57 |
GPT-3.5-Turbo |
7.94 |
50.28 |
70 |
0.57 |
Claude-1 |
7.9 |
- |
77 |
- |
Openchat-3.5 |
7.81 |
37.08 |
64.3 |
0.39 |
Dolphin-2.6-DPO |
7.74 |
42.88 |
61.9 |
0.53 |
Zephyr-7B-beta |
7.34 |
38.71 |
61.4 |
0.30 |
Llama-2-70b-chat-hf |
6.86 |
51.56 |
63 |
- |
Neural-chat-7b-v3-1 |
6.84 |
43.61 |
62.4 |
0.30 |
模型性能对比表2
模型性能对比表3
模型 |
AlpacaEval2 |
Length |
GPT-4 |
23.58% |
1365 |
GPT-4 0314 |
22.07% |
1371 |
Mistral Medium |
21.86% |
1500 |
Mixtral 8x7B v0.1 |
18.26% |
1465 |
Kunoichi-DPO-v2 |
17.19% |
1785 |
Claude 2 |
17.19% |
1069 |
Claude |
16.99% |
1082 |
Gemini Pro |
16.85% |
1315 |
GPT-4 0613 |
15.76% |
1140 |
Claude 2.1 |
15.73% |
1096 |
Mistral 7B v0.2 |
14.72% |
1676 |
GPT 3.5 Turbo 0613 |
14.13% |
1328 |
LLaMA2 Chat 70B |
13.87% |
1790 |
LMCocktail-10.7B-v1 |
13.15% |
1203 |
WizardLM 13B V1.1 |
11.23% |
1525 |
Zephyr 7B Beta |
10.99% |
1444 |
OpenHermes-2.5-Mistral (7B) |
10.34% |
1107 |
GPT 3.5 Turbo 0301 |
9.62% |
827 |
Kunoichi-7B |
9.38% |
1492 |
GPT 3.5 Turbo 1106 |
9.18% |
796 |
GPT-3.5 |
8.56% |
1018 |
Phi-2 DPO |
7.76% |
1687 |
LLaMA2 Chat 13B |
7.70% |
1513 |
萌妹卡片

📄 许可证
本项目采用 cc-by-nc-4.0
许可证。所有版权归原作者所有。
如果您希望添加特定的量化,请随时提出。