Flux-Isometric-3D-Cinematography开源模型 - 轻松生成等轴3D电影摄影风格图像

首页

Flux Isometric 3D Cinematography

由 strangerzonehf 开发

这是一个基于LoRA的文本到图像扩散模型，专注于生成等轴3D电影摄影风格的图像。

图像生成开源协议:Openrail #等轴3D渲染 #电影级摄影 #LoRA微调

下载量 103

发布时间 : 11/24/2024

模型简介

该模型基于black-forest-labs/FLUX.1-dev基础模型，通过LoRA微调实现等轴3D电影摄影风格的图像生成。

模型特点

等轴3D电影摄影风格

专门生成具有等轴视角和电影摄影风格的3D场景图像

LoRA微调

使用LoRA技术对基础扩散模型进行高效微调

多分辨率噪声处理

采用多分辨率噪声衰减技术提升图像质量

模型能力

文本到图像生成

3D场景渲染

等轴视角图像生成

使用案例

创意设计

3D场景概念设计

快速生成等轴3D场景概念图

可用于游戏、电影等前期概念设计

教育可视化

生成教学用3D场景图示

帮助理解空间关系和场景布局

🚀 通量等距3D摄影模型

本模型专注于等距3D摄影风格的图像生成，可依据输入的文本描述生成具有该风格的高质量图像，目前处于训练阶段，未来会持续优化。

🚀 快速开始

安装依赖

import torch
from pipelines import DiffusionPipeline

base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)

lora_repo = "strangerzonehf/Flux-Isometric-3D-Cinematography"
trigger_word = "Isometric 3D Cinematography"  
pipe.load_lora_weights(lora_repo)

device = torch.device("cuda")
pipe.to(device)

触发图像生成

你应该使用 Isometric 3D Cinematography 来触发图像生成。

下载模型

本模型的权重以Safetensors格式提供。点击下载，可在 “文件与版本” 选项卡中获取。

✨ 主要特性

等距3D摄影风格：能够生成具有独特等距3D摄影风格的图像。
文本驱动生成：通过输入文本描述，即可生成相应风格的图像。

📦 安装指南

import torch
from pipelines import DiffusionPipeline

base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)

lora_repo = "strangerzonehf/Flux-Isometric-3D-Cinematography"
trigger_word = "Isometric 3D Cinematography"  
pipe.load_lora_weights(lora_repo)

device = torch.device("cuda")
pipe.to(device)

💻 使用示例

基础用法

import torch
from pipelines import DiffusionPipeline

base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)

lora_repo = "strangerzonehf/Flux-Isometric-3D-Cinematography"
trigger_word = "Isometric 3D Cinematography"  
pipe.load_lora_weights(lora_repo)

device = torch.device("cuda")
pipe.to(device)

# 这里可以添加生成图像的代码逻辑

📚 详细文档

模型描述

strangerzonehf/通量等距3D摄影模型

图像处理参数

参数	值	参数	值
学习率调度器	常量	噪声偏移	0.03
优化器	AdamW	多分辨率噪声折扣	0.1
网络维度	64	多分辨率噪声迭代次数	10
网络阿尔法值	32	重复次数与步数	28 & 3900
训练轮数	25	每N轮保存一次	1