S

Svdq Int4 Flux.1 Dev

由mit-han-lab開發
SVDQuant是一種針對4比特權重和激活的後訓練量化技術,能很好地保持視覺保真度。在120億參數的FLUX.1-dev模型上,相比BF16模型實現了3.6倍的內存壓縮。
下載量 60.72k
發布時間 : 11/25/2024

模型概述

基於FLUX.1-dev模型的INT4量化版本,採用SVDQuant技術實現高效4比特權重和激活量化,顯著提升推理速度並降低內存佔用。

模型特點

高效4比特量化
採用SVDQuant技術實現4比特權重和激活量化,相比BF16模型實現3.6倍內存壓縮
優化的推理速度
在16GB顯存的筆記本4090 GPU上比16位模型提速8.7倍,比NF4 W4A16基線快3倍
視覺保真度高
在PixArt-∑模型上,其視覺質量顯著優於其他W4A4甚至W4A8基線
創新的低秩分解
通過SVD將權重分解為低秩分量和殘差,低秩分支以16比特精度運行從而緩解量化難度

模型能力

文本生成圖像
高分辨率圖像生成
快速推理

使用案例

創意設計
概念藝術生成
根據文本描述快速生成概念藝術圖像
高質量視覺輸出,適合創意工作流程
教育
教學素材生成
根據教學內容自動生成配套視覺素材
快速創建符合教學需求的圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase