🚀 通量等距3D攝影模型
本模型專注於等距3D攝影風格的圖像生成,可依據輸入的文本描述生成具有該風格的高質量圖像,目前處於訓練階段,未來會持續優化。
🚀 快速開始
安裝依賴
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-Isometric-3D-Cinematography"
trigger_word = "Isometric 3D Cinematography"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
觸發圖像生成
你應該使用 Isometric 3D Cinematography
來觸發圖像生成。
下載模型
本模型的權重以Safetensors格式提供。
點擊下載,可在 “文件與版本” 選項卡中獲取。
✨ 主要特性
- 等距3D攝影風格:能夠生成具有獨特等距3D攝影風格的圖像。
- 文本驅動生成:通過輸入文本描述,即可生成相應風格的圖像。
📦 安裝指南
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-Isometric-3D-Cinematography"
trigger_word = "Isometric 3D Cinematography"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
💻 使用示例
基礎用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-Isometric-3D-Cinematography"
trigger_word = "Isometric 3D Cinematography"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
📚 詳細文檔
模型描述
strangerzonehf/通量等距3D攝影模型
圖像處理參數
參數 |
值 |
參數 |
值 |
學習率調度器 |
常量 |
噪聲偏移 |
0.03 |
優化器 |
AdamW |
多分辨率噪聲折扣 |
0.1 |
網絡維度 |
64 |
多分辨率噪聲迭代次數 |
10 |
網絡阿爾法值 |
32 |
重複次數與步數 |
28 & 3900 |
訓練輪數 |
25 |
每N輪保存一次 |
1 |
標註:florence2 - en(自然語言 & 英語)
訓練使用的總圖像數:24
最佳尺寸
- 768 x 1024(最佳)
- 1024 x 1024(默認)
🔧 技術細節
本模型基於 black - forest - labs/FLUX.1 - dev
基礎模型進行訓練,使用了LoRA技術進行微調。在訓練過程中,採用了特定的圖像處理參數,如學習率調度器、優化器等,以確保模型能夠學習到等距3D攝影風格的特徵。同時,使用了24張圖像進行訓練,並採用了特定的標註方式。
📄 許可證
本模型採用 creativeml - openrail - m
許可證。
⚠️ 重要提示
該模型仍處於訓練階段,這不是最終版本,可能會包含瑕疵,在某些情況下表現不佳。