S

Stable Diffusion V1.5

由stablediffusiontutorials開發
基於文本生成圖像的潛在擴散模型,支持512x512分辨率圖像生成
下載量 1,291
發布時間 : 9/8/2024

模型概述

Stable Diffusion是一種能夠根據文本提示生成逼真圖像的潛在擴散模型,採用CLIP ViT-L/14文本編碼器,適用於藝術創作、設計輔助等場景

模型特點

高分辨率生成
支持512x512分辨率圖像生成,輸出質量優於早期版本
無分類器引導
採用10%文本條件丟棄技術優化採樣過程
商業友好許可
允許商業用途及服務化部署,需遵守責任AI條款
多框架支持
同時支持Diffusers庫和原始GitHub倉庫兩種使用方式

模型能力

文本到圖像生成
圖像風格轉換
藝術創作輔助
概念可視化

使用案例

創意設計
概念藝術創作
根據文字描述快速生成概念藝術圖
生成符合提示語意的視覺化作品
產品設計原型
生成產品設計草圖供團隊討論
快速可視化設計概念
教育研究
生成模型研究
研究擴散模型的侷限性與偏差
發現並改進模型的社會文化偏見
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase