Ddpm Ema Cat 256
基於擴散概率模型的高質量圖像生成模型,在無條件圖像生成任務中表現優異
下載量 50
發布時間 : 7/19/2022
模型概述
該模型利用擴散概率模型實現高質量的圖像合成,支持漸進式有損解壓縮方案,可視為自迴歸解碼的泛化。在CIFAR10和LSUN數據集上取得了當前最優的生成質量。
模型特點
高質量圖像生成
在CIFAR10數據集上取得9.46的Inception分數和3.17的FID分數,生成質量達到當前最優水平
多調度器支持
支持DDPM、DDIM和PNDM三種噪聲調度器,可根據需求在生成質量和推理速度之間進行權衡
漸進式解壓縮
模型自然地支持漸進式有損解壓縮方案,可視為自迴歸解碼的泛化
模型能力
無條件圖像生成
高質量圖像合成
漸進式圖像解壓縮
使用案例
創意設計
隨機圖像生成
生成高質量隨機圖像,可用於創意設計靈感來源
生成256x256分辨率的逼真圖像
數據增強
訓練數據擴充
為計算機視覺任務生成額外的訓練樣本
可生成與真實數據分佈相似的合成圖像
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98