SD3-Controlnet-Inpainting開源圖像修復模型 - 支持高分辨率圖像修復與文字生成

首頁

SD3 Controlnet Inpainting

由alimama-creative開發

基於SD3-medium微調的控制網修復模型，支持高分辨率圖像修復和文字生成

圖像生成英語開源協議:其他 #高分辨率圖像修復 #文字內容生成 #人像審美優化

下載量 209

發布時間 : 7/30/2024

模型概述

該模型是基於SD3-medium微調的控制網修復模型，專注於圖像修復任務，能夠保持非修復區域的完整性並支持文字內容生成。

模型特點

高分辨率修復

依託SD3的16通道VAE和1024高分辨率生成能力，完美保持非修復區域的完整性

文字生成

支持通過修復生成文字內容，這在圖像修復模型中較為罕見

人像審美表現

在人像生成方面展現卓越的審美表現

與SDXL修復模型對比優勢

相比SDXL修復模型，在保持細節和生成質量方面有明顯提升

模型能力

圖像修復

高分辨率圖像生成

文字內容生成

人像生成

使用案例

圖像編輯

物體替換

將圖像中的特定物體替換為其他物體

示例中展示了將公園長椅上的老虎替換為小狗的效果

服裝設計

修改人物服裝樣式

示例展示了修改女性連衣裙樣式的效果

品牌元素添加

在圖像中添加品牌標識或文字

示例展示了在帽子和水桶上添加品牌文字的效果

室內設計

傢俱佈置

修改室內傢俱佈置

示例展示了在臥室牆壁上添加空調的效果

🚀 SD3 Controlnet Inpainting模型

本模型是基於文本生成圖像的模型，它已被集成到Diffusers庫中，能方便地使用。它在圖像修復等方面有著出色的表現，能有效保留非修復區域的完整性，還能通過修復生成文本，在人像生成上有較好的美學效果。

🚀 快速開始

本模型已集成至 Diffusers，可便捷使用。

✨ 主要特性

圖像示例

SD3

一位穿著白色夾克、黑色帽子和黑色褲子的女士站在田野裡，帽子上寫著SD3

bucket_alibaba

一個穿著白色鞋子的人，提著一個寫有“alibaba”字樣的白色水桶

SD3 Controlnet圖像修復

基於sd3 - medium微調的Controlnet圖像修復模型，該圖像修復模型具有以下優勢：

利用SD3的16通道VAE和1024的高分辨率生成能力，模型能有效保留非修復區域的完整性，包括文本。
能夠通過圖像修復生成文本。
在人像生成方面表現出更優的美學性能。

與 SDXL - Inpainting 相比：從左到右依次為：輸入圖像、遮罩圖像、SDXL圖像修復結果、本模型結果。

一隻老虎坐在公園長椅上

一隻狗坐在公園長椅上

一位年輕女士穿著藍粉相間的碎花連衣裙

一位穿著白色夾克、黑色帽子和黑色褲子的女士站在田野裡，帽子上寫著SD3

一臺空調掛在臥室牆上

📦 安裝指南

從源代碼安裝並運行：

pip uninstall diffusers
pip install git+https://github.com/huggingface/diffusers

💻 使用示例

基礎用法

import torch
from diffusers.utils import load_image, check_min_version
from diffusers.pipelines import StableDiffusion3ControlNetInpaintingPipeline
from diffusers.models.controlnet_sd3 import SD3ControlNetModel

controlnet = SD3ControlNetModel.from_pretrained(
    "alimama-creative/SD3-Controlnet-Inpainting", use_safetensors=True, extra_conditioning_channels=1
)
pipe = StableDiffusion3ControlNetInpaintingPipeline.from_pretrained(
    "stabilityai/stable-diffusion-3-medium-diffusers",
    controlnet=controlnet,
    torch_dtype=torch.float16,
)
pipe.text_encoder.to(torch.float16)
pipe.controlnet.to(torch.float16)
pipe.to("cuda")

image = load_image(
    "https://huggingface.co/alimama-creative/SD3-Controlnet-Inpainting/resolve/main/images/dog.png"
)
mask = load_image(
    "https://huggingface.co/alimama-creative/SD3-Controlnet-Inpainting/resolve/main/images/dog_mask.png"
)
width = 1024
height = 1024
prompt = "A cat is sitting next to a puppy."
generator = torch.Generator(device="cuda").manual_seed(24)
res_image = pipe(
    negative_prompt="deformed, distorted, disfigured, poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, mutated hands and fingers, disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation, NSFW",
    prompt=prompt,
    height=height,
    width=width,
    control_image=image,
    control_mask=mask,
    num_inference_steps=28,
    generator=generator,
    controlnet_conditioning_scale=0.95,
    guidance_scale=7,
).images[0]
res_image.save(f"sd3.png")