Q

Qwen2.5 3B Instruct GGUF

由Mungert開發
採用IQ-DynamicGate技術的超低位量化(1-2位)模型,適用於內存受限設備和高效推理場景
下載量 704
發布時間 : 4/25/2025

模型概述

Qwen2.5-3B-Instruct是基於Qwen2.5-3B的指令優化版本,支持文本生成和聊天任務。通過創新的IQ-DynamicGate量化技術,在保持高精度的同時顯著降低內存佔用。

模型特點

IQ-DynamicGate量化技術
採用分層策略進行動態精度分配,在超低位量化(1-2位)下仍能保持較高準確性
關鍵組件保護
嵌入層和輸出層使用更高精度量化(Q5_K),減少誤差傳播
多格式支持
提供從BF16到IQ3_XS等多種量化格式,適應不同硬件需求
內存高效
最小量化版本僅需2.1GB內存,適合邊緣設備部署

模型能力

文本生成
對話系統
指令跟隨

使用案例

資源受限環境部署
邊緣設備AI助手
在內存有限的邊緣設備上部署聊天機器人
IQ1_S量化版本僅需2.1GB內存
CPU推理優化
在沒有GPU的設備上運行大型語言模型
Q4_K量化版本適合CPU推理
研究應用
超低位量化研究
研究1-2位量化對模型性能的影響
IQ-DynamicGate技術可降低39.7%困惑度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase