S

Stable Cascade

由stabilityai開發
基於Würstchen架構的高效文本生成圖像模型,通過42倍壓縮因子實現快速推理和低成本訓練
下載量 24.96k
發布時間 : 2/6/2024

模型概述

Stable Cascade是一個三階段的文本到圖像生成模型,通過高度壓縮的潛在空間顯著降低計算成本,同時保持高質量的圖像生成能力

模型特點

高效壓縮架構
採用42倍壓縮因子(1024x1024→24x24),相比Stable Diffusion的8倍壓縮顯著提升效率
低成本訓練
早期版本相比Stable Diffusion 1.5降低16倍訓練成本
兼容擴展功能
支持LoRA、ControlNet、IP-Adapter、LCM等擴展功能
多版本選擇
提供不同參數規模的模型版本(10億/36億參數等)滿足不同需求

模型能力

文本生成圖像
高分辨率圖像生成(1024x1024)
快速推理
圖像重建

使用案例

藝術創作
概念藝術生成
根據文本描述生成創意概念藝術圖像
高質量的藝術作品
設計應用
產品原型設計
快速生成產品設計原型圖像
加速設計流程
教育研究
生成模型研究
研究高效生成模型的架構和性能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase