S

Stable Diffusion 3 Medium Diffusers

stabilityaiによって開発
Stability AIが開発したマルチモーダル拡散トランスフォーマーのテキストから画像生成モデルで、画像品質、テキストレイアウト、複雑なプロンプト理解において顕著な向上を実現
ダウンロード数 118.68k
リリース時間 : 6/12/2024

モデル概要

MMDiTアーキテクチャを採用したテキストから画像生成モデルで、高品質な画像生成と複雑なテキスト理解をサポート

モデル特徴

マルチモーダルアーキテクチャ
3つの固定事前学習テキストエンコーダ(OpenCLIP-ViT/G、CLIP-ViT/L、T5-xxl)を統合
高品質生成
画像品質、テキストレイアウト、複雑なプロンプト理解において顕著な向上
リソース効率
最適化されたアーキテクチャにより、リソース利用効率が向上

モデル能力

テキストから画像生成
複雑なプロンプト理解
高品質画像生成
テキストレイアウト生成

使用事例

アート創作
コンセプトアート創作
ゲーム、映画などのためのコンセプトアート作成
高品質なコンセプトアート作品
教育
教育補助
教育コンテンツのための視覚的補助材料作成
直感的な教育用画像
デザイン
デザインプロセス支援
デザイナーが迅速にデザインコンセプトを生成するのを支援
デザインプロセスの加速
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase