P

Pixart XL 2 512x512

由PixArt-alpha開發
Pixart-α是基於Transformer架構的文本生成圖像模型,可直接通過文本提示生成1024像素圖像,訓練效率顯著優於同類模型。
下載量 3,971
發布時間 : 11/4/2023

模型概述

採用純Transformer模塊構建的潛在擴散模型,使用固定預訓練文本編碼器(T5)和潛在特徵編碼器(VAE),能夠高效生成高質量圖像。

模型特點

高效訓練
僅需Stable Diffusion v1.5訓練時間的10.8%,節省近30萬美元成本,減少90%碳排放
高質量生成
在用戶評估中表現媲美甚至超越SDXL、DALLE-2等SOTA模型
直接高分辨率生成
單次採樣即可生成1024像素圖像,無需多階段處理

模型能力

文本生成圖像
高分辨率圖像生成
藝術創作
設計輔助

使用案例

創意設計
藝術創作
根據文字描述生成藝術作品
生成具有藝術風格的圖像
概念設計
快速生成產品/場景概念圖
幫助設計師快速可視化創意
教育研究
生成模型研究
研究擴散模型的訓練效率和生成質量
提供高效的模型架構參考
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase