S

Stable Diffusion 2 1

由stabilityai開發
基於擴散的文本生成圖像模型,支持通過文本提示生成和修改圖像
下載量 948.75k
發布時間 : 12/6/2022

模型概述

Stable Diffusion v2-1是在v2版本基礎上進一步微調的文生圖模型,採用潛在擴散架構和OpenCLIP文本編碼器,可生成高質量圖像

模型特點

高質量圖像生成
基於768x768分辨率訓練,可生成細節豐富的圖像
安全過濾機制
訓練數據經過NSFW檢測器過濾(p_unsafe=0.1)
改進的微調策略
採用兩階段微調(55k步punsafe=0.1 + 155k步punsafe=0.98)
OpenCLIP文本編碼
使用OpenCLIP-ViT/H作為文本編碼器,增強文本理解能力

模型能力

文本生成圖像
圖像修改
藝術創作
設計輔助

使用案例

藝術創作
概念藝術生成
根據文字描述快速生成概念藝術圖
可生成風格多樣的創意圖像
教育研究
生成模型研究
用於研究生成模型的侷限性和偏差
可分析社會偏見在生成內容中的體現
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase