S

Stable Diffusion V1 2

CompVisによって開発
拡散ベースのテキストから画像生成モデルで、テキストプロンプトに基づいてリアルな画像を生成可能
ダウンロード数 1,322
リリース時間 : 8/19/2022

モデル概要

安定拡散は潜在的なテキストから画像への拡散モデルで、潜在拡散モデルアーキテクチャを採用し、固定された事前学習済みテキストエンコーダ(CLIP ViT-L/14)を使用して、任意のテキスト入力から画像を生成および修正できます。

モデル特徴

高解像度画像生成
512x512解像度の高品質画像を生成可能
潜在空間処理
ピクセル空間ではなく潜在空間で拡散プロセスを実行し、効率を向上
美的最適化トレーニング
選別された高品質画像データセット(laion-improved-aesthetics)で微調整
複数スケジューラ対応
PNDM、LMSDiscreteなど様々なノイズスケジューラをサポート

モデル能力

テキストから画像生成
画像修正
アート創作
デザイン支援

使用事例

アート創作
コンセプトアート生成
文章説明に基づいてアートコンセプトを生成
迅速に創造的なビジュアル表現を生成可能
教育研究
生成モデル研究
拡散モデルの限界とバイアスを研究
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase