1

14t6

由ismot開發
基於擴散的文本生成圖像模型,支持通過文本提示生成和修改圖像
下載量 24
發布時間 : 1/14/2023

模型概述

Stable Diffusion v2-1是在v2版本基礎上進一步微調的潛在擴散模型,採用OpenCLIP-ViT/H文本編碼器,支持高分辨率圖像生成

模型特點

高分辨率生成
支持768x768分辨率圖像生成,質量優於前代模型
安全訓練
採用p_unsafe=0.1的保守閾值過濾訓練數據,減少有害內容生成
多框架支持
兼容diffusers庫和原生stablediffusion代碼庫
微調優化
在v2基礎上額外訓練210k步(55k保守步+155k開放步)

模型能力

文本到圖像生成
圖像修改
藝術創作
設計輔助

使用案例

藝術創作
概念藝術生成
根據文字描述快速生成概念藝術圖
可生成多種風格的概念設計圖
教育研究
生成模型研究
用於研究生成模型的侷限性和偏差
創意工具
設計原型生成
快速生成產品設計原型圖
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase