🚀 Auraflow-DomoKun-LoRA-rank8
這是一個基於 fal/AuraFlow 的標準PEFT LoRA模型。該模型主要用於文本到圖像的轉換,能根據輸入的文本生成相應的圖像。
🚀 快速開始
推理示例
以下是使用該模型進行推理的Python代碼示例:
import torch
from diffusers import DiffusionPipeline
model_id = 'fal/AuraFlow'
adapter_id = 'bghira/Auraflow-DomoKun-LoRA-rank8'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "An domokun running through a field with flowers all around him."
negative_prompt = 'ugly, cropped, blurry, low-quality, mediocre average'
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
model_output = pipeline(
prompt=prompt,
negative_prompt=negative_prompt,
num_inference_steps=30,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=512,
height=512,
guidance_scale=4.0,
).images[0]
model_output.save("output.png", format="PNG")
✨ 主要特性
- 基於 fal/AuraFlow 模型派生而來,是標準的PEFT LoRA模型。
- 支持文本到圖像、圖像到圖像的轉換。
- 可通過配置不同的參數生成多樣化的圖像。
📚 詳細文檔
驗證設置
- CFG:
4.0
- CFG Rescale:
0.0
- Steps:
30
- Sampler:
FlowMatchEulerDiscreteScheduler
- Seed:
42
- Resolution:
512x512
注意:驗證設置不一定與訓練設置相同。
訓練設置
屬性 |
詳情 |
訓練輪數 |
0 |
訓練步數 |
100 |
學習率 |
0.0001 |
學習率調度 |
常量 |
熱身步數 |
100 |
最大梯度值 |
0.01 |
有效批量大小 |
3 |
微批量大小 |
1 |
梯度累積步數 |
1 |
GPU數量 |
3 |
梯度檢查點 |
啟用 |
預測類型 |
flow_matching (額外參數=['shift=3']) |
優化器 |
adamw_bf16 |
可訓練參數精度 |
Pure BF16 |
基礎模型精度 |
no_change |
字幕丟棄概率 |
10.0% |
LoRA秩 |
8 |
LoRA Alpha |
8.0 |
LoRA丟棄率 |
0.1 |
LoRA初始化風格 |
默認 |
數據集
domokun-cropped-512-NonReg
- 重複次數: 10
- 圖像總數: ~36
- 寬高比桶總數: 7
- 分辨率: 0.262144 兆像素
- 是否裁剪: 否
- 裁剪風格: 無
- 裁剪寬高比: 無
- 是否用於正則化數據: 否
domokun-cropped-512
- 重複次數: 10
- 圖像總數: ~36
- 寬高比桶總數: 2
- 分辨率: 0.262144 兆像素
- 是否裁剪: 否
- 裁剪風格: 無
- 裁剪寬高比: 無
- 是否用於正則化數據: 是
📄 許可證
本項目採用Apache-2.0許可證。