ddpm - cifar10 - 32オープンソース画像生成モデル - 拡散アルゴリズムに基づいて高品質画像を出力

Ddpm Cifar10 32

googleによって開発

拡散確率モデルに基づく高品質画像生成モデルで、CIFAR10およびLSUNデータセットで優れた性能を発揮します。

画像生成オープンソースライセンス:Apache-2.0 #無条件画像生成 #漸進的ノイズ除去 #高品質画像合成

ダウンロード数 30.58k

リリース時間 : 6/16/2022

モデル概要

DDPMは非平衡熱力学に着想を得た潜在変数モデルで、漸進的なノイズ除去プロセスを通じて高品質な画像を生成します。無条件画像生成タスクをサポートし、CIFAR10および256x256 LSUNデータセットで現在最高のFIDスコアを達成しています。

モデル特徴

高品質画像生成

CIFAR10データセットで3.17のFIDスコアを達成し、ProgressiveGANと同等のサンプル品質を実現

漸進的ノイズ除去

段階的にノイズを除去する自然なプロセスで画像を生成し、漸進的な非可逆圧縮方式をサポート

複数スケジューラ対応

DDPM、DDIM、PNDMなど複数のノイズスケジューラをサポートし、生成品質と速度の間で柔軟に選択可能

モデル能力

無条件画像生成

高品質サンプル合成

漸進的画像ノイズ除去

使用事例

画像生成

CIFAR10画像生成

32x32解像度のCIFAR10スタイル画像を生成

Inceptionスコア9.46、FIDスコア3.17

高解像度画像生成

256x256解像度のLSUNスタイル画像を生成

ProgressiveGANと同等のサンプル品質

🚀 ノイジング拡散確率モデル (DDPM)

拡散確率モデルを用いた高品質な画像合成結果を提示します。このモデルは非平衡熱力学から着想を得た潜在変数モデルの一種です。

🚀 クイックスタート

このREADMEでは、ノイジング拡散確率モデル (DDPM) について説明します。DDPMは、拡散確率モデルを用いた画像合成に関する研究です。

論文情報

論文：Denoising Diffusion Probabilistic Models
著者：Jonathan Ho, Ajay Jain, Pieter Abbeel
概要：拡散確率モデルを用いた高品質な画像合成結果を提示します。このモデルは非平衡熱力学から着想を得た潜在変数モデルの一種です。最良の結果は、拡散確率モデルとランゲヴィンダイナミクスを用いたノイズ除去スコアマッチングとの新しい関係に基づいて設計された重み付き変分バウンドで訓練することで得られます。また、このモデルは自然に漸進的な損失圧縮スキームを許容し、これは自己回帰デコードの一般化と解釈できます。無条件のCIFAR10データセットでは、Inceptionスコア9.46と最先端のFIDスコア3.17を達成しています。256x256のLSUNでは、ProgressiveGANに匹敵するサンプル品質を得ています。

💻 使用例

基本的な使用法

# !pip install diffusers
from diffusers import DDPMPipeline, DDIMPipeline, PNDMPipeline

model_id = "google/ddpm-cifar10-32"

# load model and scheduler
ddpm = DDPMPipeline.from_pretrained(model_id)  # you can replace DDPMPipeline with DDIMPipeline or PNDMPipeline for faster inference

# run pipeline in inference (sample random noise and denoise)
image = ddpm().images[0]

# save image
image.save("ddpm_generated_image.png")

高度な使用法

# より詳細な情報については、公式の推論サンプルを参照してください。
# For more in-detail information, please have a look at the [official inference example](https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/diffusers_intro.ipynb)