🚀 通量等距3D摄影模型
本模型专注于等距3D摄影风格的图像生成,可依据输入的文本描述生成具有该风格的高质量图像,目前处于训练阶段,未来会持续优化。
🚀 快速开始
安装依赖
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-Isometric-3D-Cinematography"
trigger_word = "Isometric 3D Cinematography"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
触发图像生成
你应该使用 Isometric 3D Cinematography
来触发图像生成。
下载模型
本模型的权重以Safetensors格式提供。
点击下载,可在 “文件与版本” 选项卡中获取。
✨ 主要特性
- 等距3D摄影风格:能够生成具有独特等距3D摄影风格的图像。
- 文本驱动生成:通过输入文本描述,即可生成相应风格的图像。
📦 安装指南
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-Isometric-3D-Cinematography"
trigger_word = "Isometric 3D Cinematography"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
💻 使用示例
基础用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/Flux-Isometric-3D-Cinematography"
trigger_word = "Isometric 3D Cinematography"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
📚 详细文档
模型描述
strangerzonehf/通量等距3D摄影模型
图像处理参数
参数 |
值 |
参数 |
值 |
学习率调度器 |
常量 |
噪声偏移 |
0.03 |
优化器 |
AdamW |
多分辨率噪声折扣 |
0.1 |
网络维度 |
64 |
多分辨率噪声迭代次数 |
10 |
网络阿尔法值 |
32 |
重复次数与步数 |
28 & 3900 |
训练轮数 |
25 |
每N轮保存一次 |
1 |
标注:florence2 - en(自然语言 & 英语)
训练使用的总图像数:24
最佳尺寸
- 768 x 1024(最佳)
- 1024 x 1024(默认)
🔧 技术细节
本模型基于 black - forest - labs/FLUX.1 - dev
基础模型进行训练,使用了LoRA技术进行微调。在训练过程中,采用了特定的图像处理参数,如学习率调度器、优化器等,以确保模型能够学习到等距3D摄影风格的特征。同时,使用了24张图像进行训练,并采用了特定的标注方式。
📄 许可证
本模型采用 creativeml - openrail - m
许可证。
⚠️ 重要提示
该模型仍处于训练阶段,这不是最终版本,可能会包含瑕疵,在某些情况下表现不佳。