1

14t6

ismotによって開発
拡散ベースのテキストから画像を生成するモデルで、テキストプロンプトによる画像生成と編集をサポート
ダウンロード数 24
リリース時間 : 1/14/2023

モデル概要

Stable Diffusion v2-1はv2バージョンをさらに微調整した潜在拡散モデルで、OpenCLIP-ViT/Hテキストエンコーダーを採用し、高解像度画像生成をサポート

モデル特徴

高解像度生成
768x768解像度の画像生成をサポートし、前世代モデルよりも品質が向上
安全なトレーニング
p_unsafe=0.1の保守的な閾値でトレーニングデータをフィルタリングし、有害なコンテンツ生成を削減
マルチフレームワークサポート
diffusersライブラリとネイティブのstablediffusionコードベースの両方に対応
微調整最適化
v2ベースに210kステップ(55k保守ステップ+155k開放ステップ)を追加トレーニング

モデル能力

テキストから画像生成
画像編集
アート創作
デザイン支援

使用事例

アート創作
コンセプトアート生成
テキスト説明に基づいて迅速にコンセプトアートを生成
様々なスタイルのコンセプトデザインを生成可能
教育研究
生成モデル研究
生成モデルの限界とバイアスを研究するために使用
クリエイティブツール
デザインプロトタイプ生成
製品デザインのプロトタイプを迅速に生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase