🚀 simpletuner-controlnet-sdxl-lora-test
これは stabilityai/stable-diffusion-xl-base-1.0 をベースにした ControlNet PEFT LoHa です。
学習中に使用される主な検証プロンプトは以下の通りです。
リアルな猫の写真
🚀 クイックスタート
このプロジェクトは特定のベースモデルと検証プロンプトを使用して学習されており、以下の手順で推論操作を行うことができます。
✨ 主な機能
- ControlNet PEFT LoHa 技術に基づき、
stabilityai/stable-diffusion-xl-base-1.0
モデルから派生しています。
- テキストから画像への変換を実現し、リアルな画像を生成することができます。
- 学習と検証の過程では詳細なパラメータ設定が行われ、モデルの安定性と精度が保証されています。
📦 インストール
ドキュメントに具体的なインストール手順は記載されていません。diffusers
、torch
などの関連依存ライブラリの公式ドキュメントを参照してインストールしてください。
💻 使用例
基本的な使用法
import torch
from diffusers import DiffusionPipeline
model_id = 'stabilityai/stable-diffusion-xl-base-1.0'
adapter_id = 'bghira/simpletuner-controlnet-sdxl-lora-test'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "A photo-realistic image of a cat"
negative_prompt = 'blurry, cropped, ugly'
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
model_output = pipeline(
prompt=prompt,
negative_prompt=negative_prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=1024,
height=1024,
guidance_scale=4.2,
guidance_rescale=0.0,
).images[0]
model_output.save("output.png", format="PNG")
高度な使用法
ドキュメントに高度な使用法に関するコード例は記載されていません。prompt
、negative_prompt
、num_inference_steps
などの推論パラメータを実際のニーズに合わせて調整することができます。
📚 ドキュメント
検証設定
- CFG:
4.2
- CFG リスケーリング:
0.0
- ステップ数:
20
- サンプラー:
ddim
- シード:
42
- 解像度:
1024x1024
注意:検証設定は 学習設定 と必ずしも一致しない場合があります。
以下のギャラリーでいくつかのサンプル画像を見ることができます。
テキストエンコーダは 学習されていません。ベースモデルのテキストエンコーダを再利用して推論を行うことができます。
学習設定
データセット
antelope-data
- 繰り返し回数:0
- 画像総数:24
- アスペクト比バケット総数:1
- 解像度:1.048576 メガピクセル
- クロップ:あり
- クロップスタイル:中央
- クロップアスペクト比:正方形
- 正則化データに使用:いいえ
🔧 技術詳細
このプロジェクトは ControlNet PEFT LoHa 技術に基づき、stabilityai/stable-diffusion-xl-base-1.0
モデルから派生しています。学習過程では特定の検証プロンプトと詳細な学習パラメータ設定を使用して、モデルの性能と精度を保証しています。また、推論過程ではベースモデルとアダプタの重みをロードすることで画像生成を行うことができます。
📄 ライセンス
このプロジェクトは creativeml-openrail-m
ライセンスを採用しています。