🚀 sd35m-sfwbooru-v1.1ds
這是一個基於 stabilityai/stable-diffusion-3.5-medium 的全秩微調模型。該模型在圖像生成方面有著出色的表現,能夠根據輸入的文本提示生成高質量的圖像。
🚀 快速開始
推理示例
import torch
from diffusers import DiffusionPipeline
model_id = 'bghira/sd35m-sfwbooru-v1.1ds'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
prompt = "A photo-realistic image of a cat"
negative_prompt = 'blurry, cropped, ugly'
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
model_output = pipeline(
prompt=prompt,
negative_prompt=negative_prompt,
num_inference_steps=50,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=1024,
height=1024,
guidance_scale=1.0,
skip_guidance_layers=[],
).images[0]
model_output.save("output.png", format="PNG")
✨ 主要特性
- 基於
stabilityai/stable-diffusion-3.5-medium
進行全秩微調,繼承了基礎模型的強大能力。
- 文本編碼器未進行訓練,可複用基礎模型的文本編碼器進行推理。
- 提供了豐富的訓練和推理設置,可根據需求進行調整。
📚 詳細文檔
驗證設置
屬性 |
詳情 |
CFG |
1.0 |
CFG Rescale |
0.0 |
步數 |
50 |
採樣器 |
FlowMatchEulerDiscreteScheduler |
種子 |
42 |
分辨率 |
1024x1024 |
跳過層引導 |
skip_guidance_layers=[] |
注意:驗證設置不一定與訓練設置相同。
訓練設置
屬性 |
詳情 |
訓練輪數 |
0 |
訓練步數 |
28000 |
學習率 |
1.0 |
學習率調度 |
餘弦 |
熱身步數 |
500 |
最大梯度值 |
0.1 |
有效批量大小 |
32 |
微批量大小 |
4 |
梯度累積步數 |
1 |
GPU 數量 |
8 |
梯度檢查點 |
True |
預測類型 |
流匹配 (額外參數=['flow_schedule_auto_shift', 'shift=0.0']) |
優化器 |
prodigy |
可訓練參數精度 |
Pure BF16 |
基礎模型精度 |
no_change |
字幕丟棄概率 |
10.0% |
數據集
sfwbooru-crop
- 重複次數:0
- 圖像總數:~363920
- 縱橫比桶總數:1
- 分辨率:1.048576 兆像素
- 裁剪:True
- 裁剪風格:隨機
- 裁剪縱橫比:方形
- 是否用於正則化數據:否
dalle3
- 重複次數:0
- 圖像總數:~1188408
- 縱橫比桶總數:40
- 分辨率:1.048576 兆像素
- 裁剪:False
- 裁剪風格:無
- 裁剪縱橫比:無
- 是否用於正則化數據:否
指數移動平均 (EMA)
SimpleTuner 會生成 EMA 權重的 safetensors 變體和一個 pt 文件。safetensors 文件用於推理,pt 文件用於繼續微調。EMA 模型可能會提供更全面的結果,但與完整模型相比,通常會感覺訓練不足,因為它是模型權重的運行衰減平均值。
📄 許可證
本項目使用其他許可證。