T

Torben

由scheissegalo開發
基於文本生成圖像的潛在擴散模型,能夠根據文本輸入生成逼真圖像
下載量 14
發布時間 : 11/17/2022

模型概述

Stable-Diffusion-v1-5是基於v1-2權重在laion-aesthetics v2 5+數據集上微調的文本到圖像生成模型,支持512x512分辨率圖像生成,採用潛在擴散模型架構和CLIP ViT-L/14文本編碼器

模型特點

高分辨率圖像生成
支持512x512分辨率的高質量圖像生成
無分類器引導採樣
採用10%文本條件丟棄技術優化採樣過程
商業友好許可
允許商用及服務化用途的權重再分發
潛在空間處理
在潛在空間而非像素空間進行擴散過程,提高效率

模型能力

文本生成圖像
藝術創作
設計輔助
教育工具開發

使用案例

藝術創作
概念藝術生成
根據文字描述快速生成概念藝術圖像
可用於遊戲、電影前期概念設計
教育工具
創意教學輔助
將抽象概念可視化輔助教學
增強教學互動性和趣味性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase