L

Ldm Celebahq 256

CompVisによって開発
潜在拡散モデル(LDM)は潜在空間に拡散モデルを適用した効率的な画像生成手法で、計算需要を大幅に削減しながら高品質な生成効果を維持します。
ダウンロード数 268
リリース時間 : 7/15/2022

モデル概要

LDMは事前訓練済みオートエンコーダの潜在空間に拡散モデルを適用することで、複雑さの低減と細部の保持のバランスを実現し、無条件画像生成、意味的シーン合成、超解像などのタスクをサポートします。

モデル特徴

潜在空間拡散
事前訓練済みオートエンコーダの潜在空間に拡散モデルを適用し、計算需要を大幅に削減しながら高品質な生成効果を維持します。
効率的な推論
ピクセルベースの拡散モデルと比較して、LDMは推論時の計算リソース消費を大幅に削減します。
柔軟な条件制御
クロスアテンション層を通じてテキストやバウンディングボックスなどの汎用的な条件入力をサポートし、制御可能な画像生成を実現します。

モデル能力

無条件画像生成
高解像度画像合成
潜在空間画像処理

使用事例

クリエイティブコンテンツ生成
顔画像生成
CelebA-HQデータセットで訓練されたモデルを使用して高品質な顔画像を生成
256x256解像度の顔画像を生成
画像処理
画像超解像
低解像度画像を高解像度バージョンに変換
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase