P

Pixart Sigma XL 2 1024 MS

由PixArt-alpha開發
PixArt-Σ是基於Transformer架構的潛在擴散模型,可直接通過文本提示生成高分辨率圖像(最高4K)。
下載量 7,283
發布時間 : 4/11/2024

模型概述

採用純Transformer模塊構建的潛在擴散模型,支持單次採樣生成1024像素、2K及4K分辨率圖像,集成T5文本編碼器和VAE潛在特徵編碼器。

模型特點

高分辨率生成
支持單次採樣生成最高4K分辨率的圖像
高效Transformer架構
採用純Transformer模塊構建,計算效率優於傳統擴散模型
多模態集成
集成T5文本編碼器和VAE潛在特徵編碼器,實現高質量文本-圖像對齊

模型能力

文本生成圖像
高分辨率圖像生成
圖像編輯

使用案例

創意設計
藝術創作輔助
根據文字描述自動生成創意概念圖
快速可視化創意構思
設計原型生成
為產品/界面設計提供快速原型
加速設計迭代過程
教育研究
生成模型研究
探索擴散Transformer架構的性能邊界
推動生成模型技術進步
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase