🚀 Flux.1-Dev-Hand-Sticky-LoRA
本模型是一個文本到圖像的模型,藉助LoRA技術,可生成與手持貼紙相關的圖像,為圖像創作提供新的可能。
🚀 快速開始
模型設置
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/Flux.1-Dev-Hand-Sticky-LoRA"
trigger_word = "handstick69"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
觸發圖像生成
你應該使用 handstick69
來觸發圖像生成。
下載模型
此模型的權重以Safetensors格式提供。
點擊下載,可在“文件與版本”選項卡中獲取。
✨ 主要特性
- 文本到圖像轉換:根據輸入的文本描述,生成與之對應的手持貼紙圖像。
- LoRA技術:利用低秩自適應(LoRA)技術,提高模型訓練效率和性能。
📦 安裝指南
暫未提供具體安裝步驟,可參考上述快速開始部分的代碼示例進行模型設置。
💻 使用示例
基礎用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/Flux.1-Dev-Hand-Sticky-LoRA"
trigger_word = "handstick69"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
text = f'{trigger_word}, a human hand is holding two small stickers, each with the words "you can do this!" written on them in black text. The left sticker is pink, while the right sticker is yellow, with black text written on it. Behind the hand, there is a plant with green leaves and a white tile floor.'
image = pipe(text).images[0]
image.show()
📚 詳細文檔
模型描述
prithivMLmods/Flux.1-Dev-Hand-Sticky-LoRA
圖像處理參數
參數 |
值 |
參數 |
值 |
LR調度器 |
constant |
噪聲偏移 |
0.03 |
優化器 |
AdamW |
多分辨率噪聲折扣 |
0.1 |
網絡維度 |
64 |
多分辨率噪聲迭代次數 |
10 |
網絡Alpha |
32 |
重複次數與步數 |
17 & 1920 |
輪數 |
10 |
每N輪保存一次 |
1 |
標註信息
標註採用florence2-en(自然語言 & 英語)。
訓練數據
總共使用了20張圖像進行訓練。
最佳尺寸
- 768 x 1024(最佳)
- 1024 x 1024(默認)
📄 許可證
本模型使用的許可證為creativeml-openrail-m。
⚠️ 重要提示
該模型仍處於訓練階段,這不是最終版本,可能會包含瑕疵,並且在某些情況下性能不佳。