D

Dc Ae F32c32 Sana 1.1 Diffusers

mit-han-labによって開発
DC-AEは、残差オートエンコーダと高解像度適応技術の分離により、高空間圧縮比で再建品質を維持する、高解像度拡散モデルを加速する新しいオートエンコーダアーキテクチャです。
ダウンロード数 1,127
リリース時間 : 1/24/2025

モデル概要

DC-AEは、高空間圧縮比オートエンコーダの再建精度低下の問題を解決し、画像生成品質を維持しながら拡散モデルのトレーニングと推論プロセスを大幅に加速します。

モデル特徴

高圧縮比再建
最大128倍の空間圧縮比をサポートし、高品質な画像再建能力を維持
残差オートエンコーダ
空間-チャネル変換特徴に基づく残差学習により、高圧縮比オートエンコーダの最適化問題を緩和
分離高解像度適応
3段階の分離トレーニング戦略を採用し、高圧縮比オートエンコーダの汎化ペナルティを軽減
効率的な推論
SD-VAE-f8オートエンコーダと比較し、UViT-Hモデルに対して19.1倍の推論加速を実現

モデル能力

高解像度画像生成
画像圧縮と再建
効率的な拡散モデル加速

使用事例

クリエイティブコンテンツ生成
アート創作
高品質なアート画像を迅速に生成
512x512解像度画像生成
工業デザイン
製品プロトタイプ設計
テキスト記述に基づく製品デザインコンセプト画像生成
高忠実度画像出力
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase