G

Granite 3.2 8b Instruct GGUF

由Mungert開發
IBM Granite系列8B參數指令微調語言模型,採用IQ-DynamicGate超低比特量化技術,適用於高效推理場景
下載量 1,048
發布時間 : 3/19/2025

模型概述

該模型是IBM Granite系列的中等規模語言模型,經過指令微調優化,支持文本生成任務。採用創新的IQ-DynamicGate量化技術,可在1-2比特精度下保持較高性能。

模型特點

IQ-DynamicGate量化技術
創新的1-2比特精度自適應量化方法,通過分層策略在保持內存效率的同時保留模型精度
混合精度分配
前25%和後25%層使用IQ4_XS,中間50%層使用IQ2_XXS/IQ3_S,關鍵組件使用Q5_K保護
高效推理
針對CPU和低顯存設備優化,提供多種量化版本適應不同硬件環境

模型能力

文本生成
指令跟隨
低資源推理

使用案例

邊緣計算
移動設備AI助手
在內存受限的移動設備上部署智能助手
IQ1_M量化版本困惑度降低43.9%
研究開發
超低比特量化研究
作為1-2比特量化技術的研究平臺
IQ2_S量化版本在僅增加0.2GB情況下降低36.9%困惑度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase