🚀 圖標生成器
這是一個基於 black-forest-labs/FLUX.1-dev 的標準PEFT LoRA模型,可用於生成簡約風格的圖標。
🚀 快速開始
本項目是一個圖標生成器,基於特定的基礎模型派生而來,可用於生成各種簡約風格的圖標。以下是使用該生成器的基本步驟和相關信息。
✨ 主要特性
- 基於
black-forest-labs/FLUX.1-dev
基礎模型派生,具有良好的生成能力。
- 可生成多種簡約風格的圖標,如箭頭、笑臉等。
- 提供了詳細的訓練和驗證設置,便於復現和調整。
📦 安裝指南
此文檔未提及具體安裝命令,故跳過此章節。
💻 使用示例
基礎用法
import torch
from diffusers import DiffusionPipeline
model_id = 'black-forest-labs/FLUX.1-dev'
adapter_id = 'noahyoungs/icon-generator'
pipeline = DiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.bfloat16)
pipeline.load_lora_weights(adapter_id)
prompt = "Minimalist icon, arrow up"
from optimum.quanto import quantize, freeze, qint8
quantize(pipeline.transformer, weights=qint8)
freeze(pipeline.transformer)
pipeline.to('cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu')
image = pipeline(
prompt=prompt,
num_inference_steps=20,
generator=torch.Generator(device='cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu').manual_seed(42),
width=1024,
height=1024,
guidance_scale=3.0,
).images[0]
image.save("output.png", format="PNG")
📚 詳細文檔
驗證設置
- CFG:
3.0
- CFG Rescale:
0.0
- 步數:
20
- 採樣器:
FlowMatchEulerDiscreteScheduler
- 種子:
42
- 分辨率:
1024x1024
- 跳過層引導:無
注意:驗證設置不一定與訓練設置相同。
你可以在以下圖庫中找到一些示例圖像:
文本編碼器未進行訓練,你可以複用基礎模型的文本編碼器進行推理。
訓練設置
屬性 |
詳情 |
訓練輪數 |
0 |
訓練步數 |
1000 |
學習率 |
8e-05,學習率調度為多項式,熱身步數為100 |
最大梯度範數 |
1.0 |
有效批量大小 |
1(微批量大小為1,梯度累積步數為1,GPU數量為1) |
梯度檢查點 |
啟用 |
預測類型 |
流匹配(額外參數=['shift=3', 'flux_guidance_mode=constant', 'flux_guidance_value=1.0', 'flow_matching_loss=compatible', 'flux_lora_target=all']) |
優化器 |
adamw_bf16 |
可訓練參數精度 |
純BF16 |
字幕丟棄概率 |
5.0% |
LoRA秩 |
16 |
LoRA Alpha |
無 |
LoRA丟棄率 |
0.1 |
LoRA初始化風格 |
默認 |
數據集
tabler-icons-1024
- 重複次數:10
- 圖像總數:4739
- 縱橫比桶總數:1
- 分辨率:1.048576兆像素
- 裁剪:否
- 裁剪風格:無
- 裁剪縱橫比:無
- 用於正則化數據:否
推理
推理代碼示例見使用示例。
🔧 技術細節
本項目基於 black-forest-labs/FLUX.1-dev
基礎模型,通過PEFT LoRA技術進行微調。在訓練過程中,使用了特定的數據集和訓練設置,以生成簡約風格的圖標。推理時,加載基礎模型和LoRA權重,並根據提示生成圖標。
📄 許可證
許可證類型:其他