D

Deepcoder 14B Preview GGUF

由Mungert開發
採用IQ-DynamicGate技術的超低位量化(1-2比特)模型,適用於內存受限設備和邊緣計算場景
下載量 1,764
發布時間 : 4/11/2025

模型概述

基於DeepSeek-R1蒸餾版Qwen-14B的文本生成模型,採用創新的IQ-DynamicGate量化技術,在保持極致內存效率的同時優化精度

模型特點

IQ-DynamicGate量化技術
採用分層特定策略的精度自適應量化,在1-2比特超低位量化下仍保持較高準確性
關鍵組件保護
嵌入層和輸出層使用Q5_K保持精度,減少38%誤差傳播
混合量化策略
前25%和後25%層使用IQ4_XS,中間50%層使用IQ2_XXS/IQ3_S,實現效率與精度的平衡

模型能力

文本生成
低內存推理
邊緣設備部署
量化研究

使用案例

內存受限部署
低顯存GPU推理
在顯存有限的GPU上運行大型語言模型
IQ1_M量化版本困惑度降低43.9%
邊緣設備AI
在資源受限的邊緣設備上部署語言模型
IQ3_XS版本僅需極低內存
研究應用
超低位量化研究
研究1-2比特量化的極限性能
IQ1_S在1比特下保持39.7%更好的準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase