SDXL-512开源文本生成图像模型 - 免费生成512x512高保真图像

首页

SDXL 512

由 hotshotco 开发

基于SDXL 1.0微调的文本生成图像模型，专注于512x512分辨率及附近的高保真图像生成

图像生成 #512分辨率优化 #高保真图像生成 #简化提示工程

下载量 212

发布时间 : 10/3/2023

模型简介

该模型是SDXL 1.0的微调版本，旨在简化512x512分辨率及附近区域的高保真图像生成过程。通过在多比例数据集上进行训练，保持了基础模型在更高分辨率的性能。

模型特点

优化的512x512分辨率生成

专门针对512x512分辨率及附近区域进行优化，简化了高保真图像生成的提示过程

多比例训练

使用高低分辨率批次交替训练，保持了基础模型在更高分辨率的原有性能

与Hotshot-XL兼容

推荐搭配Hotshot-XL使用，可能提供更好的生成效果

模型能力

文本到图像生成

512x512分辨率图像生成

高保真图像生成

使用案例

创意设计

人物肖像生成

生成高质量的人物肖像图像

可生成如示例所示的大笑女性等人物图像

概念艺术创作

为游戏或影视创作概念艺术

营销内容

广告素材生成

快速生成营销活动所需的视觉素材

🚀 SDXL-512

SDXL-512是一个基于SDXL 1.0微调的检查点，旨在更轻松地在512x512分辨率及其附近生成更高保真度的图像。该模型能有效解决在特定分辨率下图像生成的复杂性问题，为用户提供更便捷的图像生成体验。

image/jpeg

🚀 快速开始

安装依赖

确保将diffusers升级到 >= 0.18.2：

pip install diffusers --upgrade

此外，确保安装transformers、safetensors、accelerate以及invisible_watermark：

pip install invisible_watermark transformers accelerate safetensors

运行示例

运行管道（如果不更换调度器，它将使用默认的EulerDiscreteScheduler，在本示例中，我们将其更换为EulerAncestralDiscreteScheduler）：

from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler

pipe = StableDiffusionXLPipeline.from_pretrained(
    "hotshotco/SDXL-512",
    use_safetensors=True,
).to('cuda')

pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)

prompt = "a woman laughing"
negative_prompt = ""

image = pipe(
    prompt,
    negative_prompt=negative_prompt,
    width=512,
    height=512,
    target_size=(1024, 1024),
    original_size=(4096, 4096),
    num_inference_steps=50
).images[0]

image.save("woman_laughing.png")

✨ 主要特性

SDXL-512从SDXL 1.0微调而来，专门用于在512x512分辨率及其附近更简单地生成更高保真度的图像。
模型在精心策划的多宽高比数据集上进行微调，交替使用低分辨率和高分辨率批次（每个宽高比），以不损害基础模型在更高分辨率下的现有性能。
推荐与Hotshot-XL一起使用。

📚 详细文档

模型描述

属性	详情
开发者	Natural Synthetics Inc.
模型类型	基于扩散的文生图生成模型
许可证	CreativeML Open RAIL++-M License
模型描述	这是一个可用于在512x512分辨率及其附近生成和修改更高保真度图像的模型。
更多信息资源	查看我们的 GitHub 仓库。
微调基础模型	Stable Diffusion XL 1.0