🚀 Flux-GArt-LoRA
Flux-GArt-LoRA是一個用於圖像生成的模型,可根據文本描述生成特定場景的圖像。目前該模型仍處於訓練階段,最終效果值得期待。
🚀 快速開始
安裝與配置
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/Flux-GArt-LoRA"
trigger_word = "GArt"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
觸發圖像生成
你應該使用 GArt
來觸發圖像生成。
下載模型
此模型的權重以Safetensors格式提供。
點擊下載(在“文件與版本”選項卡中)。
✨ 主要特性
- 支持文本到圖像的生成,能根據詳細的文本描述生成對應場景的圖像。
- 提供了豐富的圖像生成示例,如沙漠中騎馬的人、沙灘上的橙色貨車、棒球場等場景。
📦 安裝指南
請參考上述“快速開始”部分的代碼示例進行安裝和配置。
💻 使用示例
基礎用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/Flux-GArt-LoRA"
trigger_word = "GArt"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
text = f"{trigger_word}, a man in a blue jacket and blue jeans is riding a brown horse down a dirt road in the middle of a desert."
image = pipe(text).images[0]
image.save("generated_image.png")
高級用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/Flux-GArt-LoRA"
trigger_word = "GArt"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
text = f"{trigger_word}, a man in a blue jacket and blue jeans is riding a brown horse down a dirt road in the middle of a desert."
num_images = 3
images = pipe(text, num_images_per_prompt=num_images).images
for i, image in enumerate(images):
image.save(f"generated_image_{i}.png")
📚 詳細文檔
模型描述
prithivMLmods/Flux-GArt-LoRA
屬性 |
詳情 |
基礎模型 |
black-forest-labs/FLUX.1-dev |
觸發詞 |
GArt |
模型類型 |
LoRA(Low-Rank Adaptation) |
標籤方式 |
florence2-en(自然語言 & 英語) |
訓練使用的總圖像數 |
14 |
圖像處理參數
參數 |
值 |
參數 |
值 |
學習率調度器 |
constant |
噪聲偏移 |
0.03 |
優化器 |
AdamW |
多分辨率噪聲折扣 |
0.1 |
網絡維度 |
64 |
多分辨率噪聲迭代次數 |
10 |
網絡阿爾法值 |
32 |
重複次數 & 步數 |
15 & 2500 |
訓練輪數 |
10 |
每N輪保存一次 |
1 |
最佳尺寸
- 768 x 1024(最佳)
- 1024 x 1024(默認)
📄 許可證
本模型採用creativeml-openrail-m許可證。
⚠️ 重要提示
該模型仍處於訓練階段,這不是最終版本,可能會包含瑕疵,並且在某些情況下表現不佳。