D

Doohickey Mega V1.01

doohickeyによって開発
高解像度画像合成に最適化された安定拡散モデルで、Stable Diffusion v1.5をファインチューニングし、768x768解像度の画像生成をサポート
ダウンロード数 37
リリース時間 : 11/14/2022

モデル概要

このモデルはrunwayml/stable-diffusion-v1-5をファインチューニングした高解像度画像生成モデルで、改良されたCLIPテキストエンコーダーを採用し、クリエイティブな画像生成タスクに適しています

モデル特徴

高解像度最適化
768x768解像度に特化してファインチューニングされており、高品質な画像生成に適しています
改良されたCLIPエンコーダー
オリジナルのOpenAI CLIPモデルをlaion/CLIP-ViT-L-14-laion2B-s32B-b82Kに置き換えています
軽量ファインチューニング
わずか6000ステップのトレーニングで、モデルの安定性を保ちながら性能を最適化

モデル能力

テキストから画像生成
高解像度画像合成
クリエイティブコンテンツ生成

使用事例

クリエイティブデザイン
コンセプトアート制作
テキスト記述に基づいて高品質なコンセプトアート作品を生成
768x768解像度のコンセプトアート画像
デジタルイラスト生成
テキストプロンプトに基づいて自動的にデジタルイラストを生成
高忠実度のイラスト作品
コンテンツ制作
ソーシャルメディアコンテンツ生成
ソーシャルメディアに必要なビジュアルコンテンツを迅速に生成
ソーシャルプラットフォーム共有に適した高品質画像
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase