🚀 3D-Render-Flux-LoRA
本項目的 3D-Render-Flux-LoRA 模型可用於文本到圖像的生成,特別是 3D 肖像和 3D 渲染風格的圖像。它基於特定的基礎模型進行訓練,能根據輸入的文本描述生成相應的圖像。
🚀 快速開始
環境設置
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/3D-Render-Flux-LoRA"
trigger_word = "3D Portrait, 3d render"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
觸發圖像生成
你應該使用 3D Portrait, 3d render
來觸發圖像生成。
模型下載
此模型的權重以 Safetensors 格式提供。
點擊下載,可在“文件與版本”選項卡中獲取。
✨ 主要特性
- 文本到圖像生成:能夠根據輸入的文本描述生成 3D 肖像和 3D 渲染風格的圖像。
- 多風格支持:可以生成多種不同風格和主題的 3D 圖像,如兒童肖像、貓的特寫、漢堡等。
📦 安裝指南
暫未提供具體安裝步驟。
💻 使用示例
基礎用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/3D-Render-Flux-LoRA"
trigger_word = "3D Portrait, 3d render"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
📚 詳細文檔
模型描述
prithivMLmods/3D-Render-Flux-LoRA
屬性 |
詳情 |
模型類型 |
基於 LoRA 的文本到圖像生成模型 |
基礎模型 |
black-forest-labs/FLUX.1-dev |
實例提示詞 |
3D Portrait |
許可證 |
creativeml-openrail-m |
圖像處理參數
參數 |
值 |
參數 |
值 |
LR 調度器 |
constant |
噪聲偏移 |
0.03 |
優化器 |
AdamW |
多分辨率噪聲折扣 |
0.1 |
網絡維度 |
64 |
多分辨率噪聲迭代次數 |
10 |
網絡 Alpha |
32 |
重複次數與步數 |
27 & 3000 |
訓練輪數 |
15 |
每 N 輪保存一次 |
1 |
標註信息
標註使用 florence2-en(自然語言 & 英語)。
訓練數據
總共使用了 19 張高分辨率圖像進行訓練。
最佳尺寸
數據源
🔧 技術細節
模型仍處於訓練階段,這不是最終版本,可能包含偽影,並且在某些情況下表現不佳。
📄 許可證
本模型使用 creativeml-openrail-m 許可證。
⚠️ 重要提示
模型仍處於訓練階段,這不是最終版本,可能包含偽影,並且在某些情況下表現不佳。
💡 使用建議
可通過 Hugging Face 空間進行模型體驗:https://huggingface.co/spaces/prithivMLmods/FLUX-LoRA-DLC 。