S

Stable Diffusion 3.5 Large

stabilityaiによって開発
マルチモーダル拡散トランスフォーマーアーキテクチャに基づくテキストから画像生成モデルで、画像品質、レイアウト効果、複雑なプロンプト理解において顕著な向上を実現
ダウンロード数 143.20k
リリース時間 : 10/22/2024

モデル概要

テキストプロンプトから高品質な画像を生成可能で、クリエイティブデザインや教育ツール開発などのシーンに適応

モデル特徴

マルチモーダル拡散トランスフォーマーアーキテクチャ
MMDiTアーキテクチャを採用し、3つの固定事前学習テキストエンコーダを統合、画像生成品質を向上
QK正規化技術
トレーニング安定性を強化し、モデル性能を向上
マルチテキストエンコーダ対応
CLIPシリーズとT5テキストエンコーダをサポートし、テキスト理解能力を強化
リソース効率最適化
量子化展開ソリューションを提供し、GPUメモリ使用量を削減

モデル能力

テキストから画像生成
複雑なプロンプト理解
高品質画像生成
レイアウト効果最適化

使用事例

クリエイティブデザイン
アート創作
テキスト記述に基づき芸術作品を生成
高品質なアート画像
デザイン支援
デザイナーにクリエイティブなインスピレーションを提供
多様なデザインコンセプト
教育ツール
教育コンテンツ生成
教育ツール向け画像コンテンツを生成
豊富な教育素材
研究
生成モデル研究
テキストから画像生成モデルの研究に利用
先進的なモデルアーキテクチャと技術
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase