O

Olmo 2 0325 32B Instruct GGUF

由Mungert開發
基於OLMo-2-0325-32B-DPO的指令微調模型,採用IQ-DynamicGate超低比特量化技術,專為內存受限環境優化。
下載量 15.57k
發布時間 : 4/2/2025

模型概述

該模型是一個32B參數的大語言模型,經過指令微調,支持文本生成任務。採用創新的IQ-DynamicGate量化技術,可在1-2比特超低精度下保持較高性能。

模型特點

IQ-DynamicGate超低比特量化
創新的1-2比特量化技術,採用精度自適應策略,在保持極致內存效率的同時減少錯誤傳播。
分層量化策略
對模型不同層採用差異化量化方案,關鍵組件保留更高精度,平衡性能與效率。
多格式支持
提供從BF16到IQ3_XS等多種量化格式,適應不同硬件環境和性能需求。

模型能力

文本生成
指令跟隨
低內存推理

使用案例

資源受限環境部署
邊緣設備推理
在內存有限的邊緣設備上運行大型語言模型
IQ1_M量化版本困惑度降低43.9%
CPU推理優化
在沒有GPU加速的CPU環境中高效運行模型
Q4_K量化版本適合內存有限的CPU推理
研究應用
超低比特量化研究
研究1-2比特量化對模型性能的影響
IQ2_S量化版本困惑度降低36.9%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase