I

IF I XL V1.0

DeepFloydによって開発
DeepFloyd-IFはピクセルベースのテキストから画像への3段階カスケード拡散モデルで、革新的な写実スタイルと言語理解能力を備えた画像を生成できます。
ダウンロード数 35.23k
リリース時間 : 4/6/2023

モデル概要

DeepFloyd-IFはモジュラー設計を採用し、凍結テキストモジュールと3つのピクセルカスケード拡散モジュールで構成され、64x64、256x256、1024x1024と解像度を段階的に向上させます。

モデル特徴

効率的な生成
COCOデータセットでゼロショットFID-30Kスコア6.66を達成し、現在の最先端モデルを凌駕しました。
マルチカスケード生成
3段階のカスケード拡散モジュールにより、64x64から1024x1024まで画像解像度を段階的に向上させます。
深い言語理解
T5トランスフォーマーベースの凍結テキストエンコーダーを使用してテキスト埋め込みを抽出し、画像生成の意味的精度を向上させます。

モデル能力

テキストから画像生成
高解像度画像生成
多言語サポート

使用事例

クリエイティブデザイン
アート創作
テキスト記述に基づいて芸術作品を生成
芸術的なスタイルの画像を生成
広告デザイン
広告コンセプト画像を迅速に生成
広告ニーズに合致した画像を生成
教育
教育補助
教育用イラストを生成
教育内容に関連した画像を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase