S

Stable Diffusion 3.5 Large Ungated

adamo1139によって開発
マルチモーダル拡散トランスフォーマー(MMDiT)を基盤とした高度なテキストから画像生成モデルで、画像品質、文字レイアウト、プロンプト理解において顕著な向上を実現
ダウンロード数 169
リリース時間 : 10/22/2024

モデル概要

アクセス制限を解除したStable Diffusion 3.5 Largeバージョンで、テキストプロンプトに基づく高品質画像生成をサポート

モデル特徴

マルチモーダル拡散トランスフォーマーアーキテクチャ
革新的なMMDiTアーキテクチャを採用し、3つの事前学習済みテキストエンコーダを統合、画像生成品質を向上
QK正規化技術
QK正規化技術を適用してトレーニング安定性を確保し、モデル性能を向上
複雑なプロンプト理解
複数のオブジェクトや複雑な関係を含むテキストプロンプトを正確に理解して実現
文字レイアウト能力
生成画像内でテキスト内容を正確に表現し、複数のフォントやレイアウトスタイルをサポート

モデル能力

テキストから画像生成
複雑なシーン理解
高品質画像合成
テキスト埋め込み画像

使用事例

クリエイティブデザイン
コンセプトアート創作
ゲーム、映画などのエンターテインメント産業向けに迅速にコンセプトアートを生成
高品質なコンセプトデザイン図で、手作業による描画時間を節約
広告素材生成
製品説明に基づいてマーケティング用画像素材を自動生成
多様な広告クリエイティブ案
教育ツール
教育補助
教育コンテンツ向けの補助イラストを生成
生き生きとした直観的な教材
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase