Simpletuner-Lora开源模型 - 免费实现文本与图像、图像与图像自由转换

首页

Simpletuner Lora

由 binarydaddy 开发

simpletuner-lora是一个基于PEFT LoRA的文本到图像、图像到图像转换模型，源自FLUX.1-dev模型。

文本生成图像开源协议:其他 #高分辨率图像生成 #LoRA微调 #艺术特效创作

下载量 249

发布时间 : 6/19/2025

模型简介

该模型是一个轻量级的LoRA适配器，用于增强FLUX.1-dev模型在文本到图像和图像到图像转换任务中的表现。

模型特点

高效微调

使用LoRA技术进行参数高效微调，保持基础模型性能的同时减少训练成本

高分辨率输出

支持1024x1024高分辨率图像生成

BF16支持

支持BF16精度，可在兼容硬件上实现高效推理

模型能力

文本到图像生成

图像到图像转换

高分辨率图像生成

使用案例

创意设计

特效元素生成

根据文本描述生成2D视觉特效元素

示例中生成红色和黄色火焰效果

🚀 simpletuner-lora

simpletuner-lora是一个标准的PEFT LoRA，源自black-forest-labs/FLUX.1-dev，可用于文本到图像、图像到图像等转换任务。

🚀 快速开始

推理示例

import torch
from diffusers import DiffusionPipeline

model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'binarydaddy/simpletuner-lora'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16) # loading directly in bf16
pipeline.load_lora_weights(adapter_id)

prompt = "A 2D vfx of flame effect in red and yellow, glazing against black background"


## Optional: quantise the model to save on vram.
## Note: The model was not quantised during training, so it is not necessary to quantise it during inference time.
#from optimum.quanto import quantize, freeze, qint8
#quantize(pipeline.transformer, weights=qint8)
#freeze(pipeline.transformer)
    
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu') # the pipeline is already in its target precision level
model_output = pipeline(
    prompt=prompt,
    num_inference_steps=20,
    generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
    width=1024,
    height=1024,
    guidance_scale=3.0,
).images[0]

model_output.save("output.png", format="PNG")

✨ 主要特性

基于black-forest-labs/FLUX.1-dev模型派生，可用于文本到图像、图像到图像等转换。
训练过程中使用特定的验证提示和设置，以确保模型效果。
文本编码器未进行训练，推理时可复用基础模型的文本编码器。

📚 详细文档

验证设置

CFG：3.0
CFG Rescale：0.0
步数：20
采样器：FlowMatchEulerDiscreteScheduler
种子：42
分辨率：1024x1024
跳过层引导：

注意：验证设置不一定与训练设置相同。

你可以在以下图库中找到一些示例图像：

训练设置

属性	详情
训练轮数	0
训练步数	1000
学习率	0.0001
学习率调度	多项式
热身步数	100
最大梯度值	2.0
有效批量大小	8
微批量大小	1
梯度累积步数	1
GPU数量	8
梯度检查点	启用
预测类型	flow_matching (额外参数=['shift=3', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flux_lora_target=all'])
优化器	adamw_bf16
可训练参数精度	Pure BF16
基础模型精度	`no_change`
字幕丢弃概率	0.1%
LoRA秩	512
LoRA Alpha	无
LoRA丢弃率	0.1
LoRA初始化风格	默认