S

Stable Diffusion V3 5 Large GGUF

由gpustack開發
Stable Diffusion 3.5大模型是一款多模態擴散變換器(MMDiT)文生圖模型,在圖像質量、文字排版、複雜提示詞理解和資源效率方面均有顯著提升。
下載量 13.33k
發布時間 : 11/11/2024

模型概述

基於多模態擴散變換器架構的文生圖模型,支持高質量圖像生成和複雜文本理解

模型特點

多模態擴散變換器架構
採用創新的MMDiT架構,結合多個預訓練文本編碼器,提升圖像生成質量
QK歸一化技術
使用QK歸一化技術顯著提升訓練穩定性
多文本編碼器支持
整合OpenCLIP-ViT/G、CLIP-ViT/L和T5-xxl三種文本編碼器,增強文本理解能力
高效資源利用
提供多種量化選項,可在不同硬件配置上高效運行

模型能力

文本到圖像生成
複雜提示理解
高質量圖像合成
文字排版生成

使用案例

藝術創作
概念藝術創作
為遊戲、電影等媒體創作概念藝術和設計素材
生成具有特定風格和主題的高質量藝術作品
插畫生成
根據文字描述自動生成插畫
快速產出符合需求的視覺內容
設計與營銷
廣告素材生成
為營銷活動快速生成視覺素材
提高創意產出效率,降低製作成本
教育與研究
生成模型研究
用於研究擴散模型的行為和侷限性
推動生成式AI技術進步
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase