P

Pixart Sigma XL 2 1024 MS

PixArt-alphaによって開発
PixArt-ΣはTransformerアーキテクチャに基づく潜在拡散モデルで、テキストプロンプトから直接高解像度画像(最大4K)を生成できます。
ダウンロード数 7,283
リリース時間 : 4/11/2024

モデル概要

純粋なTransformerモジュールで構築された潜在拡散モデルで、単一サンプリングで1024ピクセル、2Kおよび4K解像度の画像を生成可能。T5テキストエンコーダーとVAE潜在特徴エンコーダーを統合。

モデル特徴

高解像度生成
単一サンプリングで最大4K解像度の画像を生成可能
効率的なTransformerアーキテクチャ
純粋なTransformerモジュールを採用し、従来の拡散モデルよりも計算効率に優れる
マルチモーダル統合
T5テキストエンコーダーとVAE潜在特徴エンコーダーを統合し、高品質なテキスト-画像連携を実現

モデル能力

テキストから画像生成
高解像度画像生成
画像編集

使用事例

クリエイティブデザイン
アート創作補助
テキスト記述に基づいて自動的にクリエイティブなコンセプトアートを生成
アイデアの迅速な可視化
デザインプロトタイプ生成
製品/インターフェースデザインのための迅速なプロトタイプを提供
デザインイテレーションプロセスの加速
教育研究
生成モデル研究
拡散Transformerアーキテクチャの性能限界を探求
生成モデル技術の進歩を推進
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase