D

Diffusers Inpainting Text Box

gligenによって開発
Stable Diffusionは潜在的なテキストから画像への拡散モデルで、任意のテキスト入力からリアルな画像を生成できます。
ダウンロード数 130
リリース時間 : 3/11/2023

モデル概要

拡散ベースのテキストから画像生成モデルで、潜在拡散モデルアーキテクチャを採用し、テキスト記述から高品質な画像を生成します。

モデル特徴

高品質画像生成
テキスト入力から高解像度(512x512)のリアルな画像を生成可能
分類器不要ガイダンスサンプリング
10%のテキスト条件ドロップアウト最適化を採用し、生成品質を向上
メモリ最適化
アテンションスライシング技術をサポートし、4GB未満のGPUメモリでも動作可能
マルチプラットフォーム対応
PyTorchとJAX/Flaxフレームワークをサポートし、GPU/TPUで動作可能

モデル能力

テキストから画像生成
アート創作
デザイン支援
クリエイティブビジュアライゼーション

使用事例

アート創作
コンセプトアート生成
テキスト記述から迅速にコンセプトアート画像を生成
ゲームや映画などのプレプロダクション設計に利用可能
スタイライズド画像創作
様々なアートスタイルのプロンプトを組み合わせてユニークな画像を生成
ディズニースタイル、サイバーパンクスタイルなど
教育研究
生成モデル研究
生成モデルの限界と可能性を探求
学術研究や実験に利用
クリエイティブツール開発
モデルを基にしたクリエイティブ支援ツールの開発
デザイン支援アプリ、アート創作ツールなど
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase