P

Pixart XL 2 512x512

PixArt-alphaによって開発
Pixart-αはTransformerアーキテクチャに基づくテキストから画像生成モデルで、テキストプロンプトから直接1024ピクセルの画像を生成でき、トレーニング効率が同類モデルを大幅に上回ります。
ダウンロード数 3,971
リリース時間 : 11/4/2023

モデル概要

純粋なTransformerモジュールで構築された潜在拡散モデルで、固定の事前トレーニング済みテキストエンコーダー(T5)と潜在特徴エンコーダー(VAE)を使用し、高品質な画像を効率的に生成できます。

モデル特徴

効率的なトレーニング
Stable Diffusion v1.5のトレーニング時間のわずか10.8%で済み、約30万ドルのコスト削減と90%のCO2排出削減を実現
高品質生成
ユーザー評価ではSDXL、DALLE-2などのSOTAモデルに匹敵または凌駕する性能
直接高解像度生成
単一サンプリングで1024ピクセル画像を生成可能で、多段階処理が不要

モデル能力

テキストから画像生成
高解像度画像生成
アート創作
デザイン支援

使用事例

クリエイティブデザイン
アート創作
テキスト記述に基づいて芸術作品を生成
芸術的なスタイルの画像を生成
コンセプトデザイン
製品/シーンのコンセプト図を迅速に生成
デザイナーがアイデアを迅速に可視化する支援
教育研究
生成モデル研究
拡散モデルのトレーニング効率と生成品質を研究
効率的なモデルアーキテクチャの参考を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase