開源controlnet-canny-sdxl-1.0-small模型 - 用Canny邊緣檢測控制，小巧高效！

首頁

Controlnet Canny Sdxl 1.0 Small

由diffusers開發

基於Stable Diffusion XL訓練的小型控制網絡，專用於Canny邊緣檢測條件控制，體積比原始XL控制網絡小7倍

圖像生成 #Canny邊緣控制 #SDXL輕量優化 #圖像生成控制

下載量 567

發布時間 : 8/15/2023

模型概述

該模型是Stable Diffusion XL的輕量級控制網絡版本，專注於通過Canny邊緣檢測實現精確的圖像生成控制。它保留了原始SDXL的強大生成能力，同時顯著減小了模型體積。

模型特點

輕量級設計

模型體積比原始XL控制網絡小7倍，更適合資源有限的環境

精確邊緣控制

通過Canny邊緣檢測實現高精度的圖像結構控制

保留SDXL特性

基於stabilityai/stable-diffusion-xl-base-1.0訓練，保留了原始模型的強大生成能力

實驗性質

模型仍處於實驗階段，鼓勵社區繼續優化和改進

模型能力

基於邊緣檢測的圖像生成

高精度結構控制

照片級真實感圖像生成

藝術風格圖像生成

使用案例

創意設計

概念藝術創作

根據邊緣草圖生成完整的藝術概念圖

示例展示了未來主義研究基地的鳥瞰圖

人像攝影增強

基於邊緣輪廓生成高質量人像照片

示例展示了特寫女性肖像，具有照片級真實感

影視遊戲

角色設計

根據簡單線稿生成完整角色形象

示例展示了天啟世界中的威震天形象

場景設計

基於邊緣圖生成複雜場景

示例展示了廢墟城市背景

🚀 Small SDXL - controlnet: Canny

Small SDXL - controlnet: Canny 是基於 stabilityai/stable - diffusion - xl - base - 1.0 訓練的控制網絡權重，採用 Canny 條件。此檢查點比原始的 XL 控制網絡檢查點小 7 倍。下面為你展示一些示例圖片。

🚀 快速開始

安裝依賴

確保首先安裝所需的庫：

pip install accelerate transformers safetensors opencv-python diffusers

運行示例代碼

安裝完成後，就可以運行以下代碼：

from diffusers import ControlNetModel, StableDiffusionXLControlNetPipeline, AutoencoderKL
from diffusers.utils import load_image
from PIL import Image
import torch
import numpy as np
import cv2

prompt = "aerial view, a futuristic research complex in a bright foggy jungle, hard lighting"
negative_prompt = "low quality, bad quality, sketches"

image = load_image("https://huggingface.co/datasets/hf-internal-testing/diffusers-images/resolve/main/sd_controlnet/hf-logo.png")

controlnet_conditioning_scale = 0.5  # recommended for good generalization

controlnet = ControlNetModel.from_pretrained(
    "diffusers/controlnet-canny-sdxl-1.0-small",
    torch_dtype=torch.float16
)
vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
pipe = StableDiffusionXLControlNetPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    controlnet=controlnet,
    vae=vae,
    torch_dtype=torch.float16,
)
pipe.enable_model_cpu_offload()

image = np.array(image)
image = cv2.Canny(image, 100, 200)
image = image[:, :, None]
image = np.concatenate([image, image, image], axis=2)
image = Image.fromarray(image)

images = pipe(
    prompt, negative_prompt=negative_prompt, image=image, controlnet_conditioning_scale=controlnet_conditioning_scale,
).images

images[0].save(f"hug_lab.png")

hug_lab_grid)

更多詳細信息，請查看 StableDiffusionXLControlNetPipeline 的官方文檔。

✨ 主要特性

體積小巧：此檢查點比原始的 XL 控制網絡檢查點小 7 倍。
實驗性：該檢查點處於實驗階段，有很大的改進空間，歡迎社區在此基礎上進行優化並提供反饋。

💻 使用示例

基礎用法

from diffusers import ControlNetModel, StableDiffusionXLControlNetPipeline, AutoencoderKL
from diffusers.utils import load_image
from PIL import Image
import torch
import numpy as np
import cv2

prompt = "aerial view, a futuristic research complex in a bright foggy jungle, hard lighting"
negative_prompt = "low quality, bad quality, sketches"

image = load_image("https://huggingface.co/datasets/hf-internal-testing/diffusers-images/resolve/main/sd_controlnet/hf-logo.png")

controlnet_conditioning_scale = 0.5  # recommended for good generalization

controlnet = ControlNetModel.from_pretrained(
    "diffusers/controlnet-canny-sdxl-1.0-small",
    torch_dtype=torch.float16
)
vae = AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16)
pipe = StableDiffusionXLControlNetPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    controlnet=controlnet,
    vae=vae,
    torch_dtype=torch.float16,
)
pipe.enable_model_cpu_offload()

image = np.array(image)
image = cv2.Canny(image, 100, 200)
image = image[:, :, None]
image = np.concatenate([image, image, image], axis=2)
image = Image.fromarray(image)

images = pipe(
    prompt, negative_prompt=negative_prompt, image=image, controlnet_conditioning_scale=controlnet_conditioning_scale,
).images

images[0].save(f"hug_lab.png")

高級用法

目前文檔未提及高級用法相關代碼，可參考官方文檔進行更多探索。

🔧 技術細節

訓練腳本

訓練腳本基於官方提供的腳本構建，可參考此處。完整披露可參考此腳本。

訓練特點

未進行蒸餾：此檢查點未執行蒸餾操作，僅使用從 SDXL UNet 初始化的較小 ControlNet。鼓勵社區嘗試進行蒸餾操作，可參考此資源。
ControlNet 初始化：關於 ControlNet 的初始化方式，可參考此代碼塊。
無注意力塊：該模型沒有任何注意力塊。
性能表現：模型在大多數條件圖像上表現良好，但對於更復雜的條件，較大的檢查點可能效果更好。目前正在努力改進此檢查點的質量，並期待社區提供反饋。
參數建議：建議嘗試調整 controlnet_conditioning_scale 和 guidance_scale 參數，以獲得更好的圖像生成質量。