🚀 hidream-controlnet-lora-test
這是一個基於 HiDream-ai/HiDream-I1-Full 的 ControlNet PEFT LoRA。本項目可用於文本到圖像、圖像到圖像的轉換,具有一定的圖像生成能力。
🚀 快速開始
推理示例
import torch
from diffusers import DiffusionPipeline
model_id = 'HiDream-ai/HiDream-I1-Full'
adapter_id = 'bghira/hidream-controlnet-lora-test'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "A photo-realistic image of a cat"
negative_prompt = 'ugly, cropped, blurry, low-quality, mediocre average'
from optimum.quanto import quantize, freeze, qint8
quantize(pipeline.transformer, weights=qint8)
freeze(pipeline.transformer)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
model_output = pipeline(
prompt=prompt,
negative_prompt=negative_prompt,
num_inference_steps=16,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=256,
height=256,
guidance_scale=4.0,
).images[0]
model_output.save("output.png", format="PNG")
✨ 主要特性
🔧 技術細節
驗證設置
- CFG:
4.0
- CFG Rescale:
0.0
- 步數:
16
- 採樣器:
FlowMatchEulerDiscreteScheduler
- 種子:
42
- 分辨率:
256x256
注意:驗證設置不一定與訓練設置相同。
訓練設置
屬性 |
詳情 |
訓練輪數 |
0 |
訓練步數 |
2 |
學習率 |
0.0001 - 學習率調度:恆定 - 熱身步數:500 |
最大梯度值 |
2.0 |
有效批量大小 |
1 - 微批量大小:1 - 梯度累積步數:1 - GPU 數量:1 |
梯度檢查點 |
啟用 |
預測類型 |
flow_matching (額外參數=['shift=3.0']) |
優化器 |
adamw_bf16 |
可訓練參數精度 |
Pure BF16 |
基礎模型精度 |
int8 - quanto |
字幕丟棄概率 |
0.0% |
LoRA 秩 |
1 |
LoRA Alpha |
1.0 |
LoRA 丟棄率 |
0.1 |
LoRA 初始化風格 |
默認 |
數據集
antelope - data - 256
- 重複次數:0
- 圖像總數:29
- 縱橫比桶總數:1
- 分辨率:0.065536 兆像素
- 是否裁剪:是
- 裁剪風格:居中
- 裁剪縱橫比:方形
- 是否用於正則化數據:否
📄 許可證
本項目使用其他許可證。