icon-generator开源图标生成模型 - 免费部署生成极简风格图标

首页

Icon Generator

由 noahyoungs 开发

这是一个基于FLUX.1-dev的PEFT LoRA模型，专门用于生成极简风格的图标。

图像生成开源协议:其他 #极简图标生成 #LoRA微调 #高分辨率输出

下载量 26

发布时间 : 1/24/2025

模型简介

该模型是一个文本到图像的扩散模型，专注于生成高质量的极简图标，适用于各种工作环境和设计需求。

模型特点

极简图标生成

专门优化用于生成各种极简风格的图标

高分辨率输出

支持1024x1024高分辨率图像生成

LoRA微调

使用PEFT LoRA技术对基础模型进行微调

流匹配预测

采用流匹配(Flow Matching)预测类型

模型能力

文本到图像转换

极简图标生成

高分辨率图像生成

使用案例

UI设计

应用图标生成

为移动应用或网站生成极简风格的图标

清晰、简洁的图标设计

警示图标生成

生成警示圆圈等安全相关图标

标准化的警示标识

品牌设计

品牌图标生成

生成类似Facebook品牌风格的极简图标

具有品牌识别度的简约设计

🚀 图标生成器

这是一个基于 black-forest-labs/FLUX.1-dev 的标准PEFT LoRA模型，可用于生成简约风格的图标。

🚀 快速开始

本项目是一个图标生成器，基于特定的基础模型派生而来，可用于生成各种简约风格的图标。以下是使用该生成器的基本步骤和相关信息。

✨ 主要特性

基于 black-forest-labs/FLUX.1-dev 基础模型派生，具有良好的生成能力。
可生成多种简约风格的图标，如箭头、笑脸等。
提供了详细的训练和验证设置，便于复现和调整。

📦 安装指南

此文档未提及具体安装命令，故跳过此章节。

💻 使用示例

基础用法

import torch
from diffusers import DiffusionPipeline

model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'noahyoungs/icon-generator'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16) # loading directly in bf16
pipeline.load_lora_weights(adapter_id)

prompt = "Minimalist icon, arrow up"


## Optional: quantise the model to save on vram.
## Note: The model was quantised during training, and so it is recommended to do the same during inference time.
from optimum.quanto import quantize, freeze, qint8
quantize(pipeline.transformer, weights=qint8)
freeze(pipeline.transformer)
    
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu') # the pipeline is already in its target precision level
image = pipeline(
    prompt=prompt,
    num_inference_steps=20,
    generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
    width=1024,
    height=1024,
    guidance_scale=3.0,
).images[0]
image.save("output.png", format="PNG")

📚 详细文档

验证设置

CFG：3.0
CFG Rescale：0.0
步数：20
采样器：FlowMatchEulerDiscreteScheduler
种子：42
分辨率：1024x1024
跳过层引导：无

注意：验证设置不一定与训练设置相同。

你可以在以下图库中找到一些示例图像：

文本编码器未进行训练，你可以复用基础模型的文本编码器进行推理。

训练设置

属性	详情
训练轮数	0
训练步数	1000
学习率	8e-05，学习率调度为多项式，热身步数为100
最大梯度范数	1.0
有效批量大小	1（微批量大小为1，梯度累积步数为1，GPU数量为1）
梯度检查点	启用
预测类型	流匹配（额外参数=['shift=3', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flow_matching_loss=compatible', 'flux_lora_target=all']）
优化器	adamw_bf16
可训练参数精度	纯BF16
字幕丢弃概率	5.0%
LoRA秩	16
LoRA Alpha	无
LoRA丢弃率	0.1
LoRA初始化风格	默认