L

Ldm Celebahq 256

由CompVis開發
潛在擴散模型(LDM)是一種在潛在空間中應用擴散模型的高效圖像生成方法,顯著降低了計算需求同時保持高質量生成效果。
下載量 268
發布時間 : 7/15/2022

模型概述

LDM通過在預訓練自編碼器的潛在空間中應用擴散模型,實現了複雜度降低與細節保留的平衡,支持無條件圖像生成、語義場景合成和超分辨率等任務。

模型特點

潛在空間擴散
在預訓練自編碼器的潛在空間中應用擴散模型,顯著降低計算需求同時保持高質量生成效果。
高效推理
相比基於像素的擴散模型,LDM在推理時顯著減少了計算資源消耗。
靈活的條件控制
通過交叉注意力層支持文本或邊界框等通用條件輸入,實現可控的圖像生成。

模型能力

無條件圖像生成
高分辨率圖像合成
潛在空間圖像處理

使用案例

創意內容生成
人臉圖像生成
使用CelebA-HQ數據集訓練的模型生成高質量人臉圖像
生成256x256分辨率的人臉圖像
圖像處理
圖像超分辨率
將低分辨率圖像轉換為高分辨率版本
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase