M

Mistral 7B Instruct V0.2 GGUF

由Mungert開發
Mistral-7B-Instruct-v0.2是基於Mistral-7B架構的指令微調模型,支持文本生成任務,採用IQ-DynamicGate超低比特量化技術優化內存效率。
下載量 742
發布時間 : 3/16/2025

模型概述

該模型是一個7B參數的指令微調大語言模型,支持文本生成任務,特別優化了在低內存設備上的運行效率。

模型特點

IQ-DynamicGate超低比特量化
採用1-2比特精度自適應量化技術,在保持內存效率的同時提升模型準確性。
動態精度分配
前25%和後25%層使用IQ4_XS,中間50%層使用IQ2_XXS/IQ3_S,關鍵組件保護使用Q5_K。
多格式支持
提供BF16、F16及多種量化格式(Q4_K、Q6_K、Q8_0等),適配不同硬件需求。

模型能力

文本生成
指令跟隨
低內存推理

使用案例

內存受限部署
邊緣設備文本生成
在內存有限的邊緣設備上運行文本生成任務。
IQ1_M困惑度降低43.9%,內存佔用僅增加0.3GB
研究應用
超低比特量化研究
研究1-2比特量化對模型性能的影響。
IQ2_S困惑度降低36.9%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase