S

Stable Diffusion V 1 3 Original

CompVisによって開発
Stable Diffusionは潜在拡散モデルで、テキスト入力に基づいてリアルな画像を生成できます。v1.3バージョンはv1.2をベースに美的感覚を最適化したトレーニングを行っています。
ダウンロード数 17
リリース時間 : 8/10/2022

モデル概要

テキストプロンプトに基づいて画像を生成・編集する潜在拡散モデルで、CLIP ViT-L/14をテキストエンコーダーとして採用し、高解像度画像合成をサポートします。

モデル特徴

高解像度画像生成
512x512解像度の画像合成をサポートし、美的感覚を最適化したトレーニングを実施
分類器不要のガイド付きサンプリング
10%のテキスト条件ドロップアウト技術で生成品質を最適化
オープンライセンス
商用利用と重みの再配布を許可し、責任あるAI原則に従う

モデル能力

テキストから画像生成
画像編集
アート創作
デザイン補助

使用事例

アート創作
コンセプトアート生成
文章説明に基づいて迅速にコンセプトアートのスケッチを生成
創作プロセスを加速し、多様なデザインオプションを提供
教育研究
生成モデル研究
拡散モデルの限界とバイアスを探究するために使用
AI安全分野の発展を推進
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase