🚀 simpletuner-controlnet-sdxl-lora-test
這是一個基於 stabilityai/stable-diffusion-xl-base-1.0 的 ControlNet PEFT LoHa。
在訓練過程中使用的主要驗證提示為:
一張逼真的貓的照片
🚀 快速開始
此項目基於特定的基礎模型和驗證提示進行訓練,可通過以下步驟進行推理操作。
✨ 主要特性
- 基於 ControlNet PEFT LoHa 技術,從
stabilityai/stable-diffusion-xl-base-1.0
模型派生而來。
- 可實現文本到圖像的轉換,生成逼真的圖像。
- 訓練和驗證過程有詳細的參數設置,保證模型的穩定性和準確性。
📦 安裝指南
文檔未提及具體安裝步驟,可參考相關依賴庫的官方文檔進行安裝,如 diffusers
、torch
等。
💻 使用示例
基礎用法
import torch
from diffusers import DiffusionPipeline
model_id = 'stabilityai/stable-diffusion-xl-base-1.0'
adapter_id = 'bghira/simpletuner-controlnet-sdxl-lora-test'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "A photo-realistic image of a cat"
negative_prompt = 'blurry, cropped, ugly'
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
model_output = pipeline(
prompt=prompt,
negative_prompt=negative_prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=1024,
height=1024,
guidance_scale=4.2,
guidance_rescale=0.0,
).images[0]
model_output.save("output.png", format="PNG")
高級用法
文檔未提及高級用法相關代碼示例,可根據實際需求調整推理參數,如 prompt
、negative_prompt
、num_inference_steps
等。
📚 詳細文檔
驗證設置
- CFG:
4.2
- CFG 重縮放:
0.0
- 步數:
20
- 採樣器:
ddim
- 種子:
42
- 分辨率:
1024x1024
注意:驗證設置不一定與 訓練設置 相同。
你可以在以下圖庫中找到一些示例圖像:
文本編碼器 未 進行訓練。你可以重用基礎模型的文本編碼器進行推理。
訓練設置
數據集
antelope-data
- 重複次數:0
- 圖像總數:24
- 縱橫比桶總數:1
- 分辨率:1.048576 兆像素
- 裁剪:是
- 裁剪風格:居中
- 裁剪縱橫比:方形
- 用於正則化數據:否
🔧 技術細節
本項目基於 ControlNet PEFT LoHa 技術,從 stabilityai/stable-diffusion-xl-base-1.0
模型派生而來。在訓練過程中,使用了特定的驗證提示和詳細的訓練參數設置,以保證模型的性能和準確性。同時,在推理過程中,可通過加載基礎模型和適配器權重進行圖像生成。
📄 許可證
本項目採用 creativeml-openrail-m
許可證。