S

Stable Diffusion V1 5 Inpainting

botpによって開発
潜在拡散アーキテクチャに基づくテキスト生成画像モデルで、マスクによる画像修復機能を強化
ダウンロード数 6,191
リリース時間 : 5/5/2023

モデル概要

このモデルはテキスト入力に基づいてリアルな画像を生成できるだけでなく、マスクを使用して画像をインテリジェントに修復できます。Stable-Diffusion-v-1-2の重みで初期化され、マスク情報を処理するための5つの追加入力チャネルを備えています。

モデル特徴

二重機能
テキスト生成画像とマスクベースの画像修復を同時にサポート
強化トレーニング
LAIONデータセットで44万ステップの修復特化トレーニングを追加、10%のテキスト条件ドロップアウトで最適化
マスク処理最適化
UNetに5つの専用入力チャネルを追加、25%のトレーニングサンプルでフルマスクを使用して堅牢性を強化

モデル能力

テキストガイド画像生成
画像修復と編集
高解像度画像合成
アート創作支援

使用事例

クリエイティブデザイン
コンセプトアート生成
テキスト記述に基づいて迅速にデザインコンセプト図を生成
512x512解像度画像、複数回の反復最適化をサポート
画像編集
インテリジェント写真修正
マスクを使用して写真の欠陥を自動修復または不要な要素を削除
FID 1.00、LPIPS 0.141(LaMaなどの専門修復モデルを上回る)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase