SD15 768
S
SD15 768
Developed by panopstor
Stable Diffusion 1.5フレームワークを基にファインチューニングした画像生成モデルで、高解像度出力の安定性を最適化し、複数のアスペクト比での画像生成をサポート
Downloads 43
Release Time : 11/6/2023
Model Overview
このモデルは標準サイズ768x768または同じ総ピクセル数の複数のアスペクト比の画像生成に最適化されており、美術、写真、ビデオゲームなどの分野のコンテンツ制作に適しています
Model Features
高解像度最適化
多段階トレーニング戦略により768x768などの高解像度出力を最適化し、被写体の重複問題を軽減
縦横比バッチ対応
EveryDream2トレーナーの縦横比バッチ対応技術を採用し、クロップアーティファクトを大幅に削減
多分野トレーニングデータ
3万枚の厳選画像に基づくトレーニングで、美術、写真、ビデオゲームなど多様なテーマをカバー
トレーニング最適化戦略
段階的トレーニング計画(40エポック)とコサインアニーリング学習率戦略を採用し、8bitオプティマイザーでトレーニング効率を向上
Model Capabilities
テキストから画像生成
高解像度画像生成
複数アスペクト比画像生成
アートスタイル変換
Use Cases
デジタルアート制作
コンセプトアート生成
テキスト記述に基づきゲーム/映画用コンセプトアートを生成
高品質768x768解像度のコンセプトアート
商業デザイン
広告素材生成
マーケティングニーズに合致したビジュアル素材を迅速生成
複数アスペクト比の商業グレード画像
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98