S

Stable Diffusion V1 5

stable-diffusion-v1-5によって開発
Stable Diffusionは潜在的なテキストから画像への拡散モデルで、任意のテキスト入力からリアルな画像を生成できます。
ダウンロード数 3.7M
リリース時間 : 8/30/2024

モデル概要

拡散ベースのテキストから画像生成モデルで、CLIP ViT-L/14をテキストエンコーダーとして使用し、主にテキストプロンプトに基づいて画像を生成および修正するために使用されます。

モデル特徴

高品質画像生成
テキストプロンプトに基づいて512x512解像度のリアルな画像を生成可能
分類器不要ガイダンスサンプリング
10%のテキスト条件を破棄することでサンプリング効果を改善
マルチフレームワークサポート
Diffusersライブラリ、ComfyUI、Automatic1111など複数の使用方法をサポート

モデル能力

テキストから画像生成
画像修正
アート創作

使用事例

アート創作
コンセプトアート生成
テキスト記述に基づいてコンセプトアート作品を生成
ゲーム、映画などの分野での迅速なプロトタイプ設計に使用可能
教育研究
生成モデル研究
生成モデルの限界やバイアスを探求・理解するために使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase