D

Dc Ae F32c32 Sana 1.1 Diffusers

由mit-han-lab開發
DC-AE是一種用於加速高分辨率擴散模型的新型自編碼器架構,通過殘差自編碼和解耦高分辨率適配技術,在高空間壓縮比下保持重建質量。
下載量 1,127
發布時間 : 1/24/2025

模型概述

DC-AE解決了高空間壓縮比自編碼器重建精度下降的問題,顯著加速擴散模型的訓練和推理過程,同時保持圖像生成質量。

模型特點

高壓縮比重建
支持高達128倍的空間壓縮比,同時保持高質量圖像重建能力
殘差自編碼
基於空間-通道變換特徵學習殘差,緩解高壓縮比自編碼器的優化難題
解耦高分辨率適配
採用三階段解耦訓練策略,減輕高壓縮比自編碼器的泛化懲罰
高效推理
相比SD-VAE-f8自編碼器,為UViT-H模型帶來19.1倍推理加速

模型能力

高分辨率圖像生成
圖像壓縮與重建
高效擴散模型加速

使用案例

創意內容生成
藝術創作
快速生成高質量藝術圖像
512x512分辨率圖像生成
工業設計
產品原型設計
基於文本描述生成產品設計概念圖
高保真度圖像輸出
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase