S

Stable Diffusion 3.5 Large

由stabilityai開發
基於多模態擴散Transformer架構的文本生成圖像模型,在圖像質量、排版效果和複雜提示理解方面有顯著提升
下載量 143.20k
發布時間 : 10/22/2024

模型概述

可根據文本提示生成高質量圖像,適用於創意設計、教育工具開發等場景

模型特點

多模態擴散Transformer架構
採用MMDiT架構,集成三個固定預訓練文本編碼器,提升圖像生成質量
QK歸一化技術
增強訓練穩定性,提高模型性能
多文本編碼器支持
支持CLIP系列和T5文本編碼器,增強文本理解能力
資源效率優化
提供量化部署方案,降低顯存佔用

模型能力

文本生成圖像
複雜提示理解
高質量圖像生成
排版效果優化

使用案例

創意設計
藝術創作
根據文本描述生成藝術作品
高質量的藝術圖像
設計輔助
為設計師提供創意靈感
多樣化的設計概念
教育工具
教育內容生成
為教育工具生成圖像內容
豐富的教育素材
研究
生成模型研究
用於文本到圖像生成模型的研究
先進的模型架構和技術
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase