R

Relismoilumi

由aaronamortegui開發
基於擴散的文本生成圖像模型,支持通過文本提示生成和編輯高質量圖像
下載量 181
發布時間 : 3/9/2023

模型概述

Stable Diffusion v2-1是基於潛在擴散模型的文本生成圖像系統,採用OpenCLIP-ViT/H作為文本編碼器,支持768x768分辨率圖像生成。該版本在v2基礎上通過安全過濾策略進行了優化訓練。

模型特點

高分辨率生成
支持最高768x768分辨率的圖像生成,比前代模型有顯著提升
安全過濾優化
採用punsafe參數進行分級訓練,平衡生成質量與內容安全性
OpenCLIP文本編碼
使用OpenCLIP-ViT/H作為文本編碼器,提供更好的文本理解能力
潛在空間效率
通過8倍下采樣的潛在表示空間進行擴散,大幅降低計算資源需求

模型能力

文本生成圖像
圖像編輯
藝術創作
設計輔助

使用案例

創意設計
概念藝術創作
為遊戲/影視行業快速生成概念藝術圖
可快速迭代多種設計風格
平面設計
生成廣告、海報等設計素材
提供高質量基礎素材
教育研究
生成模型研究
研究生成模型的侷限性與偏差
可用於學術論文實驗
教學演示
展示AI生成藝術的技術原理
生動直觀的教學工具
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase