🚀 2021-Art-Flux
2021-Art-Flux 是一个文本到图像的模型,基于 LoRA 技术和 Diffusers 库构建。它能够根据输入的文本描述生成精美的卡通风格图像,适用于艺术创作、动画设计等领域。
🚀 快速开始
环境设置
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/2021-Art-Flux"
trigger_word = "2021 Art"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
触发词使用
你应该使用 2021 Art
来触发图像生成。
模型下载
该模型的权重以 Safetensors 格式提供。
点击下载,可在“文件与版本”选项卡中获取。
✨ 主要特性
- 文本到图像转换:根据输入的文本描述,生成对应的卡通风格图像。
- 多场景适用:可用于生成各种场景的图像,如人物、动物、风景等。
- 高质量输出:生成的图像具有较高的质量和细节。
📦 安装指南
暂未提供具体的安装步骤,可参考上述快速开始部分的代码示例进行环境设置。
💻 使用示例
基础用法
import torch
from pipelines import DiffusionPipeline
base_model = "black-forest-labs/FLUX.1-dev"
pipe = DiffusionPipeline.from_pretrained(base_model, torch_dtype=torch.bfloat16)
lora_repo = "strangerzonehf/2021-Art-Flux"
trigger_word = "2021 Art"
pipe.load_lora_weights(lora_repo)
device = torch.device("cuda")
pipe.to(device)
高级用法
text_description = '2021 Art, A beautiful landscape with a mountain and a lake'
image = pipe(text_description).images[0]
image.save("output_image.png")
📚 详细文档
模型描述

图像生成示例
图像生成参数
属性 |
详情 |
模型类型 |
text-to-image, lora, diffusers |
训练数据 |
总使用 29 张图像进行训练,标注使用 florence2 - en(自然语言 & 英语) |
图像处理参数
参数 |
值 |
参数 |
值 |
学习率调度器(LR Scheduler) |
constant |
噪声偏移(Noise Offset) |
0.03 |
优化器(Optimizer) |
AdamW |
多分辨率噪声折扣(Multires Noise Discount) |
0.1 |
网络维度(Network Dim) |
64 |
多分辨率噪声迭代次数(Multires Noise Iterations) |
10 |
网络阿尔法(Network Alpha) |
32 |
重复次数 & 步数(Repeat & Steps) |
20 & 3070 |
训练轮数(Epoch) |
30 |
每 N 轮保存一次(Save Every N Epochs) |
1 |
最佳尺寸与推理
尺寸 |
宽高比 |
推荐情况 |
1280 x 832 |
3:2 |
最佳 |
1024 x 1024 |
1:1 |
默认 |
推理范围
🔧 技术细节
该模型基于 LoRA 技术对基础模型 black-forest-labs/FLUX.1-dev
进行微调。在训练过程中,使用了特定的图像处理参数,如学习率调度器、优化器等,以提高模型的性能。同时,通过对不同尺寸和宽高比的图像进行测试,确定了最佳的推理尺寸和步数。
📄 许可证
该模型使用 flux-1-dev-non-commercial-license
许可证,具体详情请参考 许可证链接。