Mistral-7B-Instruct-v0.3-GPTQ-4bit開源模型 - 優化推理高效完成各種任務

Mistral 7B Instruct V0.3 GPTQ 4bit

由RedHatAI開發

Mistral-7B-Instruct-v0.3的4位量化版本，通過GPTQ方法優化推理性能，保持高精度

下載量 9,897

發布時間 : 5/23/2024

模型概述

該模型是Mistral-7B-Instruct-v0.3的4位權重量化版本，專為高效自然語言處理任務設計，在保持99.75%原始模型精度的同時提升推理速度

高效4位量化

通過GPTQ方法將模型權重壓縮至4位，顯著減少內存佔用和計算需求

高精度保持

相比原始模型保持99.75%的精度，性能損失極小

優化推理性能

支持vLLM的Marlin混合精度內核，實現高效推理

文本生成

問答系統

代碼生成

文本摘要

對話系統

教育

數學問題解答

解決GSM8K數據集中的數學問題

5-shot準確率45.41%

知識問答

常識推理

AI2 Reasoning Challenge中的推理問題

25-shot準確率63.40%

語言理解

語言理解評估

HellaSwag數據集上的語言理解測試

10-shot準確率84.04%

屬性	詳情
基礎模型	mistralai/Mistral-7B-Instruct-v0.3
量化方法	通過GPTQ將Mistral-7B-Instruct-v0.3進行僅權重量化至4位，分組大小為128
量化目標	相對於未量化模型，實現99.75%的精度恢復
許可證	Apache-2.0

數據集	任務類型	少樣本數量	指標類型	指標值
AI2 Reasoning Challenge (25-Shot)	文本生成	25	歸一化準確率	63.40
HellaSwag (10-shot)	文本生成	10	歸一化準確率	84.04
TruthfulQA (0-shot)	文本生成	0	mc2	57.48
GSM8k (5-shot)	文本生成	5	準確率	45.41
MMLU (5-Shot)	文本生成	5	準確率	61.07
Winogrande (5-shot)	文本生成	5	準確率	79.08

	Mistral-7B-Instruct-v0.3	Mistral-7B-Instruct-v0.3-GPTQ-4bit (本模型)
arc-c 25-shot	63.48	63.40
mmlu 5-shot	61.13	60.89
hellaswag 10-shot	84.49	84.04
winogrande 5-shot	79.16	79.08
gsm8k 5-shot	43.37	45.41
truthfulqa 0-shot	59.65	57.48
平均準確率	65.21	65.05
精度恢復率	100%	99.75%