L

Llama 3 3 Nemotron Super 49B V1 GGUF

由Mungert開發
採用IQ-DynamicGate超低位量化技術的49B參數大語言模型,支持1-2位精度自適應量化,優化內存效率與推理速度
下載量 434
發布時間 : 3/29/2025

模型概述

基於Llama-3架構的超大規模語言模型,通過創新的動態精度分配技術實現超低位量化,適用於內存受限環境下的高效文本生成

模型特點

IQ-DynamicGate超低位量化
採用分層動態精度分配策略,關鍵組件保護技術減少38%誤差傳播
精度自適應優化
前25%和後25%層使用IQ4_XS,中間層使用IQ2_XXS/IQ3_S,實現最優精度平衡
極致內存效率
1-2位量化版本內存佔用僅2.1-2.9GB,適合邊緣設備部署

模型能力

英語文本生成
長上下文處理(2048令牌)
超低位量化推理

使用案例

資源受限環境部署
邊緣設備文本生成
在低內存GPU/CPU設備上運行生成任務
IQ1_S量化版僅需2.1GB內存
量化技術研究
超低位量化效果驗證
測試1-2位量化對語言模型性能的影響
IQ1_M困惑度降低43.9%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase