D

Dc Ae F32c32 Sana 1.1

由mit-han-lab開發
DC-AE是一種用於加速高分辨率擴散模型的新型自編碼器架構,解決了高壓縮比下的重建精度問題
下載量 18.17k
發布時間 : 1/24/2025

模型概述

該模型通過殘差自編碼和解耦高分辨率適配技術,顯著提升了自編碼器的空間壓縮比,同時保持重建質量,可大幅加速擴散模型的訓練和推理過程

模型特點

高壓縮比
支持高達128倍的空間壓縮比,遠超傳統自編碼器的8倍壓縮比
殘差自編碼
通過空間-通道變換特徵學習殘差,有效緩解高壓縮比下的優化難題
解耦訓練策略
採用三階段解耦訓練策略,減輕高壓縮比自編碼器的泛化懲罰
高效加速
在ImageNet 512x512數據集上實現19.1倍推理加速和17.9倍訓練加速

模型能力

高分辨率圖像壓縮
潛在空間特徵提取
圖像重建
加速擴散模型訓練
加速擴散模型推理

使用案例

計算機視覺
高分辨率圖像生成
用於加速高分辨率擴散模型的訓練和推理過程
在保持生成質量的同時顯著提升速度
圖像壓縮與重建
實現高壓縮比下的高質量圖像重建
128倍壓縮比下仍能保持良好重建質量
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase