G

GLM 4 9B 0414 4bit DWQ

由Narutoouz開發
GLM-4-9B的高性能4位DWQ量化版本,專為蘋果芯片優化,支持128K長上下文。
下載量 194
發布時間 : 6/1/2025

模型概述

本項目實現了對THUDM/GLM-4-9B-0414的高性能4位DWQ量化,在蘋果設備上實現高效部署,支持長上下文生成任務。

模型特點

高性能4位量化
採用DWQ量化技術,在保持90-95%模型質量的同時大幅降低內存需求
蘋果芯片優化
針對M系列芯片深度優化,在M4 Max上達到85.23 tok/s的推理速度
長上下文支持
支持128K tokens的超長上下文處理能力(需在LM Studio中手動配置)
內存高效
量化後僅需約8GB內存,比原模型減少70%內存佔用

模型能力

長文本生成
多輪對話
知識問答
文本摘要

使用案例

內容創作
長篇文章生成
利用128K上下文能力生成連貫的長篇內容
保持上下文一致性,適合技術文檔或故事創作
開發輔助
代碼生成與補全
基於長上下文分析代碼庫並生成相關代碼
在M4 Max上達到85+ tok/s的生成速度
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase