SDXL-512開源文本生成圖像模型 - 免費生成512x512高保真圖像

首頁

SDXL 512

由hotshotco開發

基於SDXL 1.0微調的文本生成圖像模型，專注於512x512分辨率及附近的高保真圖像生成

圖像生成 #512分辨率優化 #高保真圖像生成 #簡化提示工程

下載量 212

發布時間 : 10/3/2023

模型概述

該模型是SDXL 1.0的微調版本，旨在簡化512x512分辨率及附近區域的高保真圖像生成過程。通過在多比例數據集上進行訓練，保持了基礎模型在更高分辨率的性能。

模型特點

優化的512x512分辨率生成

專門針對512x512分辨率及附近區域進行優化，簡化了高保真圖像生成的提示過程

多比例訓練

使用高低分辨率批次交替訓練，保持了基礎模型在更高分辨率的原有性能

與Hotshot-XL兼容

推薦搭配Hotshot-XL使用，可能提供更好的生成效果

模型能力

文本到圖像生成

512x512分辨率圖像生成

高保真圖像生成

使用案例

創意設計

人物肖像生成

生成高質量的人物肖像圖像

可生成如示例所示的大笑女性等人物圖像

概念藝術創作

為遊戲或影視創作概念藝術

營銷內容

廣告素材生成

快速生成營銷活動所需的視覺素材

🚀 SDXL-512

SDXL-512是一個基於SDXL 1.0微調的檢查點，旨在更輕鬆地在512x512分辨率及其附近生成更高保真度的圖像。該模型能有效解決在特定分辨率下圖像生成的複雜性問題，為用戶提供更便捷的圖像生成體驗。

image/jpeg

🚀 快速開始

安裝依賴

確保將diffusers升級到 >= 0.18.2：

pip install diffusers --upgrade

此外，確保安裝transformers、safetensors、accelerate以及invisible_watermark：

pip install invisible_watermark transformers accelerate safetensors

運行示例

運行管道（如果不更換調度器，它將使用默認的EulerDiscreteScheduler，在本示例中，我們將其更換為EulerAncestralDiscreteScheduler）：

from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler

pipe = StableDiffusionXLPipeline.from_pretrained(
    "hotshotco/SDXL-512",
    use_safetensors=True,
).to('cuda')

pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)

prompt = "a woman laughing"
negative_prompt = ""

image = pipe(
    prompt,
    negative_prompt=negative_prompt,
    width=512,
    height=512,
    target_size=(1024, 1024),
    original_size=(4096, 4096),
    num_inference_steps=50
).images[0]

image.save("woman_laughing.png")

✨ 主要特性

SDXL-512從SDXL 1.0微調而來，專門用於在512x512分辨率及其附近更簡單地生成更高保真度的圖像。
模型在精心策劃的多寬高比數據集上進行微調，交替使用低分辨率和高分辨率批次（每個寬高比），以不損害基礎模型在更高分辨率下的現有性能。
推薦與Hotshot-XL一起使用。

📚 詳細文檔

模型描述

屬性	詳情
開發者	Natural Synthetics Inc.
模型類型	基於擴散的文生圖生成模型
許可證	CreativeML Open RAIL++-M License
模型描述	這是一個可用於在512x512分辨率及其附近生成和修改更高保真度圖像的模型。
更多信息資源	查看我們的 GitHub 倉庫。
微調基礎模型	Stable Diffusion XL 1.0