S

Stable Diffusion V1 2

由CompVis開發
基於擴散的文本生成圖像模型,能夠根據文本提示生成逼真圖像
下載量 1,322
發布時間 : 8/19/2022

模型概述

穩定擴散是一種潛在文本到圖像擴散模型,採用潛在擴散模型架構,使用固定預訓練文本編碼器(CLIP ViT-L/14),能夠根據任意文本輸入生成和修改圖像。

模型特點

高分辨率圖像生成
能夠生成512x512分辨率的高質量圖像
潛在空間處理
在潛在空間而非像素空間進行擴散過程,提高效率
美學優化訓練
在篩選的高質量圖像數據集(laion-improved-aesthetics)上微調
多調度器支持
支持PNDM、LMSDiscrete等多種噪聲調度器

模型能力

文本到圖像生成
圖像修改
藝術創作
設計輔助

使用案例

藝術創作
概念藝術生成
根據文字描述生成藝術概念圖
可快速產生創意視覺表達
教育研究
生成模型研究
研究擴散模型的侷限性和偏差
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase