🚀 3D-Render-Flux-LoRA
本项目的 3D-Render-Flux-LoRA 模型可用于文本到图像的生成,特别是 3D 肖像和 3D 渲染风格的图像。它基于特定的基础模型进行训练,能根据输入的文本描述生成相应的图像。
🚀 快速开始
环境设置
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/3D-Render-Flux-LoRA"
trigger_word = "3D Portrait, 3d render"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
触发图像生成
你应该使用 3D Portrait, 3d render
来触发图像生成。
模型下载
此模型的权重以 Safetensors 格式提供。
点击下载,可在“文件与版本”选项卡中获取。
✨ 主要特性
- 文本到图像生成:能够根据输入的文本描述生成 3D 肖像和 3D 渲染风格的图像。
- 多风格支持:可以生成多种不同风格和主题的 3D 图像,如儿童肖像、猫的特写、汉堡等。
📦 安装指南
暂未提供具体安装步骤。
💻 使用示例
基础用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "prithivMLmods/3D-Render-Flux-LoRA"
trigger_word = "3D Portrait, 3d render"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
📚 详细文档
模型描述
prithivMLmods/3D-Render-Flux-LoRA
属性 |
详情 |
模型类型 |
基于 LoRA 的文本到图像生成模型 |
基础模型 |
black-forest-labs/FLUX.1-dev |
实例提示词 |
3D Portrait |
许可证 |
creativeml-openrail-m |
图像处理参数
参数 |
值 |
参数 |
值 |
LR 调度器 |
constant |
噪声偏移 |
0.03 |
优化器 |
AdamW |
多分辨率噪声折扣 |
0.1 |
网络维度 |
64 |
多分辨率噪声迭代次数 |
10 |
网络 Alpha |
32 |
重复次数与步数 |
27 & 3000 |
训练轮数 |
15 |
每 N 轮保存一次 |
1 |
标注信息
标注使用 florence2-en(自然语言 & 英语)。
训练数据
总共使用了 19 张高分辨率图像进行训练。
最佳尺寸
数据源
🔧 技术细节
模型仍处于训练阶段,这不是最终版本,可能包含伪影,并且在某些情况下表现不佳。
📄 许可证
本模型使用 creativeml-openrail-m 许可证。
⚠️ 重要提示
模型仍处于训练阶段,这不是最终版本,可能包含伪影,并且在某些情况下表现不佳。
💡 使用建议
可通过 Hugging Face 空间进行模型体验:https://huggingface.co/spaces/prithivMLmods/FLUX-LoRA-DLC 。