🚀 图标生成器
这是一个基于 black-forest-labs/FLUX.1-dev 的标准PEFT LoRA模型,可用于生成简约风格的图标。
🚀 快速开始
本项目是一个图标生成器,基于特定的基础模型派生而来,可用于生成各种简约风格的图标。以下是使用该生成器的基本步骤和相关信息。
✨ 主要特性
- 基于
black-forest-labs/FLUX.1-dev
基础模型派生,具有良好的生成能力。
- 可生成多种简约风格的图标,如箭头、笑脸等。
- 提供了详细的训练和验证设置,便于复现和调整。
📦 安装指南
此文档未提及具体安装命令,故跳过此章节。
💻 使用示例
基础用法
import torch
from diffusers import DiffusionPipeline
model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'noahyoungs/icon-generator'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "Minimalist icon, arrow up"
from optimum.quanto import quantize, freeze, qint8
quantize(pipeline.transformer, weights=qint8)
freeze(pipeline.transformer)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
prompt=prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=1024,
height=1024,
guidance_scale=3.0,
).images[0]
image.save("output.png", format="PNG")
📚 详细文档
验证设置
- CFG:
3.0
- CFG Rescale:
0.0
- 步数:
20
- 采样器:
FlowMatchEulerDiscreteScheduler
- 种子:
42
- 分辨率:
1024x1024
- 跳过层引导:无
注意:验证设置不一定与训练设置相同。
你可以在以下图库中找到一些示例图像:
文本编码器未进行训练,你可以复用基础模型的文本编码器进行推理。
训练设置
属性 |
详情 |
训练轮数 |
0 |
训练步数 |
1000 |
学习率 |
8e-05,学习率调度为多项式,热身步数为100 |
最大梯度范数 |
1.0 |
有效批量大小 |
1(微批量大小为1,梯度累积步数为1,GPU数量为1) |
梯度检查点 |
启用 |
预测类型 |
流匹配(额外参数=['shift=3', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flow_matching_loss=compatible', 'flux_lora_target=all']) |
优化器 |
adamw_bf16 |
可训练参数精度 |
纯BF16 |
字幕丢弃概率 |
5.0% |
LoRA秩 |
16 |
LoRA Alpha |
无 |
LoRA丢弃率 |
0.1 |
LoRA初始化风格 |
默认 |
数据集
tabler-icons-1024
- 重复次数:10
- 图像总数:4739
- 纵横比桶总数:1
- 分辨率:1.048576兆像素
- 裁剪:否
- 裁剪风格:无
- 裁剪纵横比:无
- 用于正则化数据:否
推理
推理代码示例见使用示例。
🔧 技术细节
本项目基于 black-forest-labs/FLUX.1-dev
基础模型,通过PEFT LoRA技术进行微调。在训练过程中,使用了特定的数据集和训练设置,以生成简约风格的图标。推理时,加载基础模型和LoRA权重,并根据提示生成图标。
📄 许可证
许可证类型:其他