D

Dc Ae F32c32 Sana 1.1

Developed by mit-han-lab
DC-AE是一种用于加速高分辨率扩散模型的新型自编码器架构,解决了高压缩比下的重建精度问题
Downloads 18.17k
Release Time : 1/24/2025

Model Overview

该模型通过残差自编码和解耦高分辨率适配技术,显著提升了自编码器的空间压缩比,同时保持重建质量,可大幅加速扩散模型的训练和推理过程

Model Features

高压缩比
支持高达128倍的空间压缩比,远超传统自编码器的8倍压缩比
残差自编码
通过空间-通道变换特征学习残差,有效缓解高压缩比下的优化难题
解耦训练策略
采用三阶段解耦训练策略,减轻高压缩比自编码器的泛化惩罚
高效加速
在ImageNet 512x512数据集上实现19.1倍推理加速和17.9倍训练加速

Model Capabilities

高分辨率图像压缩
潜在空间特征提取
图像重建
加速扩散模型训练
加速扩散模型推理

Use Cases

计算机视觉
高分辨率图像生成
用于加速高分辨率扩散模型的训练和推理过程
在保持生成质量的同时显著提升速度
图像压缩与重建
实现高压缩比下的高质量图像重建
128倍压缩比下仍能保持良好重建质量
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase