S

Stable Diffusion V1 1

CompVisによって開発
Stable Diffusionは潜在的なテキストから画像への拡散モデルで、任意のテキスト入力からリアルな画像を生成できます。
ダウンロード数 3,355
リリース時間 : 8/19/2022

モデル概要

拡散ベースのテキストから画像生成モデルで、固定された事前学習済みテキストエンコーダ(CLIP ViT-L/14)を使用した潜在拡散モデルで、Imagen論文を参考に設計されています。

モデル特徴

高解像度画像生成
512x512解像度で高品質な画像を生成可能
テキスト条件制御
テキストプロンプトを通じて生成画像の内容を精密に制御
潜在空間操作
圧縮された潜在空間で拡散プロセスを実行し、効率を向上
複数スケジューラ対応
PNDM、LMSなど複数のノイズスケジューラをサポート

モデル能力

テキストから画像生成
画像修正
アート創作
デザイン支援

使用事例

アート創作
コンセプトアート生成
テキスト記述から迅速にコンセプトアートのスケッチを生成
火星で宇宙飛行士が馬に乗っている写真などの創造的な画像
教育ツール
視覚化教育
抽象的な概念を視覚的な画像に変換して教育を支援
研究
生成モデル研究
生成モデルの限界とバイアスを研究
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase