S

Stable Diffusion V1 1

由CompVis開發
Stable Diffusion是一種潛在文本到圖像擴散模型,能夠根據任意文本輸入生成逼真圖像。
下載量 3,355
發布時間 : 8/19/2022

模型概述

基於擴散的文本生成圖像模型,採用固定預訓練文本編碼器(CLIP ViT-L/14)的潛在擴散模型,設計參考Imagen論文。

模型特點

高分辨率圖像生成
能夠在512x512分辨率下生成高質量圖像
文本條件控制
通過文本提示精確控制生成圖像內容
潛在空間操作
在壓縮的潛在空間中進行擴散過程,提高效率
多調度器支持
支持PNDM、LMS等多種噪聲調度器

模型能力

文本到圖像生成
圖像修改
藝術創作
設計輔助

使用案例

藝術創作
概念藝術生成
根據文字描述快速生成概念藝術草圖
火星上宇航員騎馬的照片等創意圖像
教育工具
可視化教學
將抽象概念轉化為可視化圖像輔助教學
研究
生成模型研究
研究生成模型的侷限性與偏差
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase