S

Stable Diffusion 2

由stabilityai開發
基於擴散模型的文本生成圖像系統,支持高分辨率圖像生成
下載量 261.26k
發布時間 : 11/23/2022

模型概述

Stable Diffusion v2是一個先進的文本到圖像生成模型,能夠根據文本提示創建和修改圖像。它基於潛在擴散模型架構,使用固定預訓練的OpenCLIP-ViT/H文本編碼器。

模型特點

高分辨率生成
支持768x768分辨率圖像生成,相比前代模型有顯著提升
v目標函數
採用改進的v目標函數訓練,提高生成質量
多分辨率支持
提供512x512和768x768兩種分辨率模型
安全過濾
訓練數據經過NSFW檢測器過濾(p_unsafe=0.1閾值)

模型能力

文本生成圖像
圖像修改
高分辨率圖像生成
藝術創作

使用案例

藝術創作
概念藝術生成
根據文字描述生成藝術概念圖
可生成風格多樣的藝術作品
設計輔助
為設計師提供創意靈感
快速可視化設計概念
研究應用
生成模型研究
研究生成模型的侷限性和偏見
安全部署研究
研究如何安全部署可能生成有害內容的模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase