🚀 Flux-SuperPortrait-v2-LoRA
Flux-SuperPortrait-v2-LoRA是一款用于图像生成的模型,基于LoRA技术,能根据文本提示生成高质量的人物肖像图像,适用于多种图像创作场景。
🚀 快速开始
环境设置
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-SuperPortrait-v2-LoRA"
trigger_word = "Super Portrait v2"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
触发词使用
你应该使用 Super Portrait v2
来触发图像生成。
模型下载
此模型的权重以Safetensors格式提供。
点击下载,可在 “Files & versions” 标签中获取。
✨ 主要特性
- 支持文本到图像的转换,能够根据详细的文本描述生成对应的人物肖像图像。
- 提供了多种图像生成参数的设置,可灵活调整以满足不同的创作需求。
- 经过特定的训练,在特定的尺寸和宽高比下能达到最佳的生成效果。
📦 安装指南
安装过程主要是通过Python代码加载基础模型和LoRA权重,具体步骤如下:
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-SuperPortrait-v2-LoRA"
trigger_word = "Super Portrait v2"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
💻 使用示例
基础用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-SuperPortrait-v2-LoRA"
trigger_word = "Super Portrait v2"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
prompt = f"{trigger_word}, A medium-angle shot of a young man in a gray hooded sweatshirt..."
image = pipe(prompt).images[0]
image.save("output.png")
📚 详细文档
图像生成参数
属性 |
详情 |
LR Scheduler |
常数(constant) |
Optimizer |
AdamW |
Network Dim |
64 |
Network Alpha |
32 |
Epoch |
15 |
Noise Offset |
0.03 |
Multires Noise Discount |
0.1 |
Multires Noise Iterations |
10 |
Repeat & Steps |
19 & 2890 |
Save Every N Epochs |
1 |
最佳尺寸与推理
尺寸 |
宽高比 |
推荐情况 |
1280 x 832 |
3:2 |
最佳 |
1024 x 1024 |
1:1 |
默认 |
推理范围
标签与训练数据
- 标签:florence2 - en(自然语言 & 英语)
- 训练使用的总图像数:29 [Flat 4K]
🔧 技术细节
该模型基于 black-forest-labs/FLUX.1-dev
基础模型,使用LoRA技术进行微调。在训练过程中,采用了特定的图像生成参数,如LR Scheduler设置为constant,Optimizer使用AdamW等。通过对29张4K图像的训练,使得模型在生成人物肖像图像方面具有较好的效果。同时,模型在特定的尺寸和宽高比下能达到最佳的生成效果,推荐的推理步数为30 - 35步。
📄 许可证
本模型遵循 creativeml-openrail-m
许可证。
