S

Stable Diffusion V3 5 Large GGUF

gpustackによって開発
Stable Diffusion 3.5大規模モデルはマルチモーダル拡散トランスフォーマー(MMDiT)を採用したテキストから画像生成モデルで、画像品質、文字レイアウト、複雑なプロンプト理解、リソース効率の面で大幅な改善が見られます。
ダウンロード数 13.33k
リリース時間 : 11/11/2024

モデル概要

マルチモーダル拡散トランスフォーマーアーキテクチャに基づくテキストから画像生成モデルで、高品質な画像生成と複雑なテキスト理解をサポート

モデル特徴

マルチモーダル拡散トランスフォーマーアーキテクチャ
革新的なMMDiTアーキテクチャを採用し、複数の事前学習済みテキストエンコーダを組み合わせることで画像生成品質を向上
QK正規化技術
QK正規化技術を使用してトレーニングの安定性を大幅に向上
複数テキストエンコーダサポート
OpenCLIP-ViT/G、CLIP-ViT/L、T5-xxlの3種類のテキストエンコーダを統合し、テキスト理解能力を強化
効率的なリソース利用
様々な量子化オプションを提供し、異なるハードウェア構成で効率的に動作

モデル能力

テキストから画像生成
複雑なプロンプト理解
高品質画像合成
文字レイアウト生成

使用事例

アート創作
コンセプトアート創作
ゲーム、映画などのメディア向けにコンセプトアートやデザイン素材を制作
特定のスタイルとテーマを持つ高品質なアート作品を生成
イラスト生成
テキスト記述に基づいて自動的にイラストを生成
ニーズに合ったビジュアルコンテンツを迅速に作成
デザイン&マーケティング
広告素材生成
マーケティングキャンペーン向けにビジュアル素材を迅速に生成
クリエイティブ生産効率を向上し、制作コストを削減
教育&研究
生成モデル研究
拡散モデルの挙動と限界を研究するために使用
生成AI技術の進歩を促進
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase