S

Stable Diffusion Xl Base 0.9

stabilityaiによって開発
Stability AIが開発した拡散ベースのテキストから画像生成モデルで、二段階潜在空間拡散プロセスを採用し、高解像度画像生成をサポート
ダウンロード数 527
リリース時間 : 6/19/2023

モデル概要

テキストプロンプトに基づいて画像を生成・修正できる潜在拡散モデルで、二つの固定事前学習テキストエンコーダ(OpenCLIP-ViT/GとCLIP-ViT/L)をベースにしている

モデル特徴

二段階潜在空間拡散
最初に基本潜在変数を生成し、その後高解像度モデルで最適化することで、より高品質な画像生成を実現
SDEdit技術統合
画像から画像生成技術を用いて初期潜在変数を最適化し、プロンプトの一貫性を保ちながら詳細表現を向上
複数テキストエンコーダサポート
OpenCLIP-ViT/GとCLIP-ViT/Lの二つのテキストエンコーダを組み合わせ、テキスト理解能力を強化

モデル能力

テキストから画像生成
画像修正・最適化
芸術創作生成
教育ツール開発

使用事例

芸術創作
コンセプトアート生成
文章記述に基づいて自動的にコンセプトアート画像を生成
多様なデザインスケッチを迅速に生成可能
教育研究
生成モデル研究
拡散モデルのアーキテクチャと訓練方法の研究に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase