S

Stable Diffusion 2 1

stabilityaiによって開発
拡散ベースのテキストから画像を生成するモデルで、テキストプロンプトによる画像生成と編集をサポート
ダウンロード数 948.75k
リリース時間 : 12/6/2022

モデル概要

Stable Diffusion v2-1はv2バージョンをさらに微調整したテキストから画像を生成するモデルで、潜在拡散アーキテクチャとOpenCLIPテキストエンコーダを採用し、高品質な画像を生成可能

モデル特徴

高品質画像生成
768x768解像度でトレーニングされており、細部まで豊かな画像を生成可能
安全フィルタリング機構
トレーニングデータはNSFW検出器でフィルタリング済み(p_unsafe=0.1)
改良された微調整戦略
2段階の微調整を採用(55kステップpunsafe=0.1 + 155kステップpunsafe=0.98)
OpenCLIPテキストエンコーディング
OpenCLIP-ViT/Hをテキストエンコーダとして使用し、テキスト理解能力を強化

モデル能力

テキストから画像生成
画像編集
アート創作
デザイン支援

使用事例

アート創作
コンセプトアート生成
テキスト記述に基づき迅速にコンセプトアートを生成
様々なスタイルのクリエイティブな画像を生成可能
教育研究
生成モデル研究
生成モデルの限界やバイアスを研究するために使用
生成コンテンツにおける社会的バイアスの分析が可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase