Flux-GArt-LoRA開源圖像生成模型 - 免費部署打造GArt藝術風格圖像

首頁

Flux GArt LoRA

由prithivMLmods開發

基於FLUX.1-dev微調的文本生成圖像擴散模型，專注於GArt藝術風格的圖像生成

圖像生成開源協議:Openrail #GArt藝術風格生成 #戶外場景渲染 #LoRA微調擴散模型

下載量 69

發布時間 : 11/23/2024

模型概述

該模型是基於擴散模型的文本生成圖像微調版本，特別針對戶外藝術和GArt風格進行優化，能夠根據文本描述生成具有特定藝術風格的圖像。

模型特點

GArt藝術風格生成

專門針對GArt藝術風格進行優化，能夠生成具有獨特藝術風格的圖像

戶外場景優化

對戶外藝術場景有特別優化，如沙漠、沙灘、棒球場等環境表現優異

LoRA微調技術

採用LoRA(Low-Rank Adaptation)技術進行高效微調，保持基礎模型能力的同時添加特定風格

多分辨率支持

支持768x1024和1024x1024等多種分辨率圖像生成

模型能力

文本生成圖像

藝術風格轉換

戶外場景生成

高分辨率圖像生成

使用案例

數字藝術創作

GArt風格插畫生成

根據文本描述生成具有GArt藝術風格的插畫作品

如示例中的牛仔騎馬穿越沙漠、沙灘露營車等場景

概念設計

戶外場景概念設計

快速生成戶外場景的概念設計圖

如示例中的棒球場全景等場景

🚀 Flux-GArt-LoRA

Flux-GArt-LoRA是一個用於圖像生成的模型，可根據文本描述生成特定場景的圖像。目前該模型仍處於訓練階段，最終效果值得期待。

🚀 快速開始

安裝與配置

import torch
from pipelines import DiffusionPipeline

base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)

lora_repo = "prithivMLmods/Flux-GArt-LoRA"
trigger_word = "GArt"  
pipe.load_lora_weights(lora_repo)

device = torch.device("cuda")
pipe.to(device)

觸發圖像生成

你應該使用 GArt 來觸發圖像生成。

下載模型

此模型的權重以Safetensors格式提供。點擊下載（在“文件與版本”選項卡中）。

✨ 主要特性

支持文本到圖像的生成，能根據詳細的文本描述生成對應場景的圖像。
提供了豐富的圖像生成示例，如沙漠中騎馬的人、沙灘上的橙色貨車、棒球場等場景。

📦 安裝指南

請參考上述“快速開始”部分的代碼示例進行安裝和配置。

💻 使用示例

基礎用法

import torch
from pipelines import DiffusionPipeline

base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)

lora_repo = "prithivMLmods/Flux-GArt-LoRA"
trigger_word = "GArt"  
pipe.load_lora_weights(lora_repo)

device = torch.device("cuda")
pipe.to(device)

# 以下可根據具體需求修改文本描述
text = f"{trigger_word}, a man in a blue jacket and blue jeans is riding a brown horse down a dirt road in the middle of a desert."
image = pipe(text).images[0]
image.save("generated_image.png")

高級用法

# 可以進一步調整參數，如生成多張圖像等
import torch
from pipelines import DiffusionPipeline

base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)

lora_repo = "prithivMLmods/Flux-GArt-LoRA"
trigger_word = "GArt"  
pipe.load_lora_weights(lora_repo)

device = torch.device("cuda")
pipe.to(device)

text = f"{trigger_word}, a man in a blue jacket and blue jeans is riding a brown horse down a dirt road in the middle of a desert."
num_images = 3
images = pipe(text, num_images_per_prompt=num_images).images
for i, image in enumerate(images):
    image.save(f"generated_image_{i}.png")

📚 詳細文檔

模型描述

prithivMLmods/Flux-GArt-LoRA

屬性	詳情
基礎模型	black-forest-labs/FLUX.1-dev
觸發詞	GArt
模型類型	LoRA（Low-Rank Adaptation）
標籤方式	florence2-en（自然語言 & 英語）
訓練使用的總圖像數	14

圖像處理參數

參數	值	參數	值
學習率調度器	constant	噪聲偏移	0.03
優化器	AdamW	多分辨率噪聲折扣	0.1
網絡維度	64	多分辨率噪聲迭代次數	10
網絡阿爾法值	32	重複次數 & 步數	15 & 2500
訓練輪數	10	每N輪保存一次	1