🚀 Flux-SuperPortrait-v2-LoRA
Flux-SuperPortrait-v2-LoRA是一款用於圖像生成的模型,基於LoRA技術,能根據文本提示生成高質量的人物肖像圖像,適用於多種圖像創作場景。
🚀 快速開始
環境設置
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-SuperPortrait-v2-LoRA"
trigger_word = "Super Portrait v2"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
觸發詞使用
你應該使用 Super Portrait v2
來觸發圖像生成。
模型下載
此模型的權重以Safetensors格式提供。
點擊下載,可在 “Files & versions” 標籤中獲取。
✨ 主要特性
- 支持文本到圖像的轉換,能夠根據詳細的文本描述生成對應的人物肖像圖像。
- 提供了多種圖像生成參數的設置,可靈活調整以滿足不同的創作需求。
- 經過特定的訓練,在特定的尺寸和寬高比下能達到最佳的生成效果。
📦 安裝指南
安裝過程主要是通過Python代碼加載基礎模型和LoRA權重,具體步驟如下:
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-SuperPortrait-v2-LoRA"
trigger_word = "Super Portrait v2"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
💻 使用示例
基礎用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-SuperPortrait-v2-LoRA"
trigger_word = "Super Portrait v2"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
prompt = f"{trigger_word}, A medium-angle shot of a young man in a gray hooded sweatshirt..."
image = pipe(prompt).images[0]
image.save("output.png")
📚 詳細文檔
圖像生成參數
屬性 |
詳情 |
LR Scheduler |
常數(constant) |
Optimizer |
AdamW |
Network Dim |
64 |
Network Alpha |
32 |
Epoch |
15 |
Noise Offset |
0.03 |
Multires Noise Discount |
0.1 |
Multires Noise Iterations |
10 |
Repeat & Steps |
19 & 2890 |
Save Every N Epochs |
1 |
最佳尺寸與推理
尺寸 |
寬高比 |
推薦情況 |
1280 x 832 |
3:2 |
最佳 |
1024 x 1024 |
1:1 |
默認 |
推理範圍
標籤與訓練數據
- 標籤:florence2 - en(自然語言 & 英語)
- 訓練使用的總圖像數:29 [Flat 4K]
🔧 技術細節
該模型基於 black-forest-labs/FLUX.1-dev
基礎模型,使用LoRA技術進行微調。在訓練過程中,採用了特定的圖像生成參數,如LR Scheduler設置為constant,Optimizer使用AdamW等。通過對29張4K圖像的訓練,使得模型在生成人物肖像圖像方面具有較好的效果。同時,模型在特定的尺寸和寬高比下能達到最佳的生成效果,推薦的推理步數為30 - 35步。
📄 許可證
本模型遵循 creativeml-openrail-m
許可證。
