D

Ddpm Ema Cat 256

googleによって開発
拡散確率モデルに基づく高品質画像生成モデルで、無条件画像生成タスクで優れた性能を発揮
ダウンロード数 50
リリース時間 : 7/19/2022

モデル概要

このモデルは拡散確率モデルを利用して高品質な画像合成を実現し、漸進的な非可逆解圧スキームをサポートします。自己回帰復号の一般化と見なすことができます。CIFAR10とLSUNデータセットで現在最高レベルの生成品質を達成しました。

モデル特徴

高品質画像生成
CIFAR10データセットでInceptionスコア9.46、FIDスコア3.17を達成し、現在最高レベルの生成品質を実現
複数スケジューラ対応
DDPM、DDIM、PNDMの3種類のノイズスケジューラをサポートし、生成品質と推論速度の間で必要に応じてトレードオフ可能
漸進的解凍
モデルは自然に漸進的な非可逆解凍スキームをサポートし、自己回帰復号の一般化と見なすことができます

モデル能力

無条件画像生成
高品質画像合成
漸進的画像解凍

使用事例

クリエイティブデザイン
ランダム画像生成
高品質なランダム画像を生成し、クリエイティブデザインのインスピレーション源として利用可能
256x256解像度のリアルな画像を生成
データ拡張
訓練データ拡張
コンピュータビジョンタスクのための追加訓練サンプルを生成
実データ分布に類似した合成画像を生成可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase