E

EXAONE Deep 7.8B GGUF

由Mungert開發
採用IQ-DynamicGate技術的超低位量化(1-2比特)的7.8B參數模型,支持英語和韓語文本生成任務。
下載量 1,791
發布時間 : 3/19/2025

模型概述

EXAONE-Deep-7.8B是一個基於LGAI-EXAONE/EXAONE-3.5-7.8B-Instruct微調的模型,採用創新的IQ-DynamicGate技術進行超低位量化,適用於內存受限的部署環境和邊緣設備。

模型特點

IQ-DynamicGate技術
採用精度自適應量化技術,在超低位模型(1-2比特)中顯著提升性能。
動態精度分配
前25%和後25%的層使用IQ4_XS,中間50%的層使用IQ2_XXS/IQ3_S,優化效率和精度。
關鍵組件保護
嵌入層和輸出層使用Q5_K,減少38%的誤差傳播。
極致內存效率
適用於內存受限的部署環境,支持CPU和邊緣設備。

模型能力

文本生成
多語言支持(英語、韓語)
超低位量化推理

使用案例

內存受限的部署環境
邊緣設備推理
在內存有限的邊緣設備上運行文本生成任務。
顯著降低內存佔用,保持合理精度。
研究與應用
超低位量化研究
探索1-2比特量化技術在大型語言模型中的應用。
提供量化性能對比數據,支持研究需求。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase