T

Torben

scheissegaloによって開発
テキスト入力からリアルな画像を生成する潜在拡散モデル
ダウンロード数 14
リリース時間 : 11/17/2022

モデル概要

Stable-Diffusion-v1-5はv1-2の重みをlaion-aesthetics v2 5+データセットでファインチューニングしたテキストから画像生成モデルで、512x512解像度の画像生成をサポートし、潜在拡散モデルアーキテクチャとCLIP ViT-L/14テキストエンコーダーを採用しています

モデル特徴

高解像度画像生成
512x512解像度の高品質画像生成をサポート
分類器不要のガイドサンプリング
10%のテキスト条件ドロップアウト技術でサンプリングプロセスを最適化
商用フレンドリーライセンス
商用利用やサービス化目的の重み再配布を許可
潜在空間処理
ピクセル空間ではなく潜在空間で拡散プロセスを行うことで効率化

モデル能力

テキストから画像生成
アートクリエーション
デザイン支援
教育ツール開発

使用事例

アートクリエーション
コンセプトアート生成
テキスト記述から迅速にコンセプトアート画像を生成
ゲームや映画のプリプロダクションコンセプトデザインに活用可能
教育ツール
創造的教育支援
抽象概念を可視化して教育を支援
教育のインタラクティブ性と面白さを向上
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase