SD3-Controlnet-Inpainting开源图像修复模型 - 支持高分辨率图像修复与文字生成

首页

SD3 Controlnet Inpainting

由 alimama-creative 开发

基于SD3-medium微调的控制网修复模型，支持高分辨率图像修复和文字生成

图像生成英语开源协议:其他 #高分辨率图像修复 #文字内容生成 #人像审美优化

下载量 209

发布时间 : 7/30/2024

模型简介

该模型是基于SD3-medium微调的控制网修复模型，专注于图像修复任务，能够保持非修复区域的完整性并支持文字内容生成。

模型特点

高分辨率修复

依托SD3的16通道VAE和1024高分辨率生成能力，完美保持非修复区域的完整性

文字生成

支持通过修复生成文字内容，这在图像修复模型中较为罕见

人像审美表现

在人像生成方面展现卓越的审美表现

与SDXL修复模型对比优势

相比SDXL修复模型，在保持细节和生成质量方面有明显提升

模型能力

图像修复

高分辨率图像生成

文字内容生成

人像生成

使用案例

图像编辑

物体替换

将图像中的特定物体替换为其他物体

示例中展示了将公园长椅上的老虎替换为小狗的效果

服装设计

修改人物服装样式

示例展示了修改女性连衣裙样式的效果

品牌元素添加

在图像中添加品牌标识或文字

示例展示了在帽子和水桶上添加品牌文字的效果

室内设计

家具布置

修改室内家具布置

示例展示了在卧室墙壁上添加空调的效果

🚀 SD3 Controlnet Inpainting模型

本模型是基于文本生成图像的模型，它已被集成到Diffusers库中，能方便地使用。它在图像修复等方面有着出色的表现，能有效保留非修复区域的完整性，还能通过修复生成文本，在人像生成上有较好的美学效果。

🚀 快速开始

本模型已集成至 Diffusers，可便捷使用。

✨ 主要特性

图像示例

SD3

一位穿着白色夹克、黑色帽子和黑色裤子的女士站在田野里，帽子上写着SD3

bucket_alibaba

一个穿着白色鞋子的人，提着一个写有“alibaba”字样的白色水桶

SD3 Controlnet图像修复

基于sd3 - medium微调的Controlnet图像修复模型，该图像修复模型具有以下优势：

利用SD3的16通道VAE和1024的高分辨率生成能力，模型能有效保留非修复区域的完整性，包括文本。
能够通过图像修复生成文本。
在人像生成方面表现出更优的美学性能。

与 SDXL - Inpainting 相比：从左到右依次为：输入图像、遮罩图像、SDXL图像修复结果、本模型结果。

一只老虎坐在公园长椅上

一只狗坐在公园长椅上

一位年轻女士穿着蓝粉相间的碎花连衣裙

一位穿着白色夹克、黑色帽子和黑色裤子的女士站在田野里，帽子上写着SD3

一台空调挂在卧室墙上

📦 安装指南

从源代码安装并运行：

pip uninstall diffusers
pip install git+https://github.com/huggingface/diffusers

💻 使用示例

基础用法

import torch
from diffusers.utils import load_image, check_min_version
from diffusers.pipelines import StableDiffusion3ControlNetInpaintingPipeline
from diffusers.models.controlnet_sd3 import SD3ControlNetModel

controlnet = SD3ControlNetModel.from_pretrained(
    "alimama-creative/SD3-Controlnet-Inpainting", use_safetensors=True, extra_conditioning_channels=1
)
pipe = StableDiffusion3ControlNetInpaintingPipeline.from_pretrained(
    "stabilityai/stable-diffusion-3-medium-diffusers",
    controlnet=controlnet,
    torch_dtype=torch.float16,
)
pipe.text_encoder.to(torch.float16)
pipe.controlnet.to(torch.float16)
pipe.to("cuda")

image = load_image(
    "https://huggingface.co/alimama-creative/SD3-Controlnet-Inpainting/resolve/main/images/dog.png"
)
mask = load_image(
    "https://huggingface.co/alimama-creative/SD3-Controlnet-Inpainting/resolve/main/images/dog_mask.png"
)
width = 1024
height = 1024
prompt = "A cat is sitting next to a puppy."
generator = torch.Generator(device="cuda").manual_seed(24)
res_image = pipe(
    negative_prompt="deformed, distorted, disfigured, poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, mutated hands and fingers, disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation, NSFW",
    prompt=prompt,
    height=height,
    width=width,
    control_image=image,
    control_mask=mask,
    num_inference_steps=28,
    generator=generator,
    controlnet_conditioning_scale=0.95,
    guidance_scale=7,
).images[0]
res_image.save(f"sd3.png")