D

Ddpm Ema Cat 256

由google開發
基於擴散概率模型的高質量圖像生成模型,在無條件圖像生成任務中表現優異
下載量 50
發布時間 : 7/19/2022

模型概述

該模型利用擴散概率模型實現高質量的圖像合成,支持漸進式有損解壓縮方案,可視為自迴歸解碼的泛化。在CIFAR10和LSUN數據集上取得了當前最優的生成質量。

模型特點

高質量圖像生成
在CIFAR10數據集上取得9.46的Inception分數和3.17的FID分數,生成質量達到當前最優水平
多調度器支持
支持DDPM、DDIM和PNDM三種噪聲調度器,可根據需求在生成質量和推理速度之間進行權衡
漸進式解壓縮
模型自然地支持漸進式有損解壓縮方案,可視為自迴歸解碼的泛化

模型能力

無條件圖像生成
高質量圖像合成
漸進式圖像解壓縮

使用案例

創意設計
隨機圖像生成
生成高質量隨機圖像,可用於創意設計靈感來源
生成256x256分辨率的逼真圖像
數據增強
訓練數據擴充
為計算機視覺任務生成額外的訓練樣本
可生成與真實數據分佈相似的合成圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase