S

Stable Diffusion 1.5

Jialiによって開発
テキストから画像を生成する潜在拡散モデルで、任意のテキスト入力からリアルな画像を生成可能
ダウンロード数 17.12k
リリース時間 : 8/30/2024

モデル概要

Stable Diffusionは潜在テキスト画像生成拡散モデルで、潜在拡散モデルアーキテクチャとCLIP ViT-L/14テキストエンコーダを採用し、テキストプロンプトから高品質な画像生成をサポートします。

モデル特徴

高品質画像生成
テキストプロンプトから高解像度(512x512)のリアルな画像を生成可能
分類器不要ガイダンスサンプリング
10%のテキスト条件ドロップアウト最適化を採用し、生成品質を向上
商用フレンドリーライセンス
商用利用やサービスとしてのモデルウェイト再配布を許可
マルチフレームワークサポート
DiffusersライブラリまたはオリジナルGitHubリポジトリ経由での使用をサポート

モデル能力

テキストから画像生成
アート創作
デザイン支援
教育ツール開発

使用事例

アート創作
コンセプトアート生成
テキスト記述から迅速にコンセプトアート画像を生成
ゲームや映画業界などのプレビジュアライゼーションに活用可能
教育研究
生成モデル研究
生成モデルの限界とバイアスを研究
AI生成コンテンツの特性理解に貢献
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase