🚀 Flux.1-Dev-Hand-Sticky-LoRA
本模型是一个文本到图像的模型,借助LoRA技术,可生成与手持贴纸相关的图像,为图像创作提供新的可能。
🚀 快速开始
模型设置
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/Flux.1-Dev-Hand-Sticky-LoRA"
trigger_word = "handstick69"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
触发图像生成
你应该使用 handstick69
来触发图像生成。
下载模型
此模型的权重以Safetensors格式提供。
点击下载,可在“文件与版本”选项卡中获取。
✨ 主要特性
- 文本到图像转换:根据输入的文本描述,生成与之对应的手持贴纸图像。
- LoRA技术:利用低秩自适应(LoRA)技术,提高模型训练效率和性能。
📦 安装指南
暂未提供具体安装步骤,可参考上述快速开始部分的代码示例进行模型设置。
💻 使用示例
基础用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/Flux.1-Dev-Hand-Sticky-LoRA"
trigger_word = "handstick69"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
text = f'{trigger_word}, a human hand is holding two small stickers, each with the words "you can do this!" written on them in black text. The left sticker is pink, while the right sticker is yellow, with black text written on it. Behind the hand, there is a plant with green leaves and a white tile floor.'
image = pipe(text).images[0]
image.show()
📚 详细文档
模型描述
prithivMLmods/Flux.1-Dev-Hand-Sticky-LoRA
图像处理参数
参数 |
值 |
参数 |
值 |
LR调度器 |
constant |
噪声偏移 |
0.03 |
优化器 |
AdamW |
多分辨率噪声折扣 |
0.1 |
网络维度 |
64 |
多分辨率噪声迭代次数 |
10 |
网络Alpha |
32 |
重复次数与步数 |
17 & 1920 |
轮数 |
10 |
每N轮保存一次 |
1 |
标注信息
标注采用florence2-en(自然语言 & 英语)。
训练数据
总共使用了20张图像进行训练。
最佳尺寸
- 768 x 1024(最佳)
- 1024 x 1024(默认)
📄 许可证
本模型使用的许可证为creativeml-openrail-m。
⚠️ 重要提示
该模型仍处于训练阶段,这不是最终版本,可能会包含瑕疵,并且在某些情况下性能不佳。