controlnet-openpose-sdxl-1.0-safetensors開源模型 - 憑藉姿態控制高效生成圖像

首頁

Controlnet Openpose Sdxl 1.0 Safetensors

由dimitribarbot開發

基於Stable Diffusion XL的ControlNet模型，支持通過OpenPose v2姿態控制生成圖像

圖像生成開源協議:其他 #姿態控制圖像生成 #SDXL-ControlNet集成 #舞蹈動作渲染

下載量 168

發布時間 : 11/23/2024

模型概述

該模型是Stable Diffusion XL與OpenPose v2結合的ControlNet實現，能夠根據人體姿態條件生成高質量圖像。

模型特點

姿態控制生成

通過OpenPose v2檢測的人體姿態作為控制條件，精確控制生成圖像中人物的姿勢

高質量輸出

基於Stable Diffusion XL基礎模型，可生成高分辨率、細節豐富的圖像

兼容主流框架

支持通過diffusers庫直接調用，同時提供ComfyUI工作流

模型能力

姿態控制圖像生成

高質量圖像合成

人體姿態條件生成

使用案例

創意藝術

舞蹈動作生成

根據特定舞蹈姿態生成藝術圖像

示例中展示了芭蕾舞者在日落場景中的生成效果

角色姿勢設計

為虛構角色設計特定姿勢的藝術形象

示例中展示了達斯·維達跳舞的生成效果

🚀 SDXL-controlnet: OpenPose (v2)

這是一個基於StableDiffusionXL的ControlNet模型，使用OpenPose (v2)條件進行訓練，可用於文本到圖像的生成。

🚀 快速開始

此項目是 thibaud/controlnet-openpose-sdxl-1.0 的副本，允許通過 diffusers 庫直接使用其 safetensors 版本。

✨ 主要特性

基於 stabilityai/stable-diffusion-xl-base-1.0 訓練，使用OpenPose (v2) 條件。
可通過 diffusers 庫方便地集成和使用。
提供了訓練腳本和相關參數說明。

📦 安裝指南

首先，安裝所有必要的庫：

pip install -q controlnet_aux transformers accelerate
pip install -q git+https://github.com/huggingface/diffusers

💻 使用示例

基礎用法

現在，我們可以讓達斯·維達跳舞啦：

from diffusers import AutoencoderKL, StableDiffusionXLControlNetPipeline, ControlNetModel, UniPCMultistepScheduler
import torch
from controlnet_aux import OpenposeDetector
from diffusers.utils import load_image

# 計算openpose條件圖像。
openpose = OpenposeDetector.from_pretrained("lllyasviel/ControlNet")

image = load_image(
    "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/diffusers/person.png"
)
openpose_image = openpose(image)

# 初始化ControlNet管道。
controlnet = ControlNetModel.from_pretrained("dimitribarbot/controlnet-openpose-sdxl-1.0-safetensors", torch_dtype=torch.float16)
pipe = StableDiffusionXLControlNetPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0", controlnet=controlnet, torch_dtype=torch.float16
)
pipe.enable_model_cpu_offload()

# 推理。
prompt = "Darth vader dancing in a desert, high quality"
negative_prompt = "low quality, bad quality"
images = pipe(
    prompt, 
    negative_prompt=negative_prompt,
    num_inference_steps=25,
    num_images_per_prompt=4,
    image=openpose_image.resize((1024, 1024)),
    generator=torch.manual_seed(97),
).images
images[0]