Q

Qwen2.5 7B Instruct 1M GGUF

由Mungert開發
Qwen2.5-7B-Instruct-1M是基於Qwen2.5-7B的指令微調版本,採用IQ-DynamicGate超低位量化技術(1-2比特),適用於內存受限環境下的高效推理。
下載量 1,342
發布時間 : 3/18/2025

模型概述

該模型是一個7B參數規模的大型語言模型,經過指令微調優化,支持文本生成任務,特別適用於聊天場景。採用最新的IQ-DynamicGate量化技術,可在超低位量化下保持較高準確性。

模型特點

IQ-DynamicGate超低位量化
採用1-2比特精度自適應量化技術,在保持極致內存效率的同時保留準確性。
分層量化策略
前25%和後25%的層使用IQ4_XS,中間50%的層使用IQ2_XXS/IQ3_S,關鍵組件使用Q5_K保護。
高效推理
針對CPU和邊緣設備優化,在內存受限環境下仍能保持合理推理速度。

模型能力

文本生成
聊天對話
指令跟隨

使用案例

內存受限環境部署
邊緣設備聊天助手
在低內存邊緣設備上部署聊天機器人應用
相比標準量化方法,困惑度降低最高達43.9%
研究應用
超低位量化研究
研究1-2比特量化對模型性能的影響
提供多種量化變體供研究比較
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase