🚀 二維碼條件控制網絡模型,適用於Stable Diffusion 2.1
本項目為Stable Diffusion 2.1提供了基於二維碼條件的ControlNet模型,可實現圖像到圖像的轉換,為圖像生成帶來更多創意與可能。

🚀 快速開始
安裝依賴
pip -q install diffusers transformers accelerate torch xformers
使用示例
import torch
from PIL import Image
from diffusers import StableDiffusionControlNetImg2ImgPipeline, ControlNetModel, DDIMScheduler
from diffusers.utils import load_image
controlnet = ControlNetModel.from_pretrained("DionTimmer/controlnet_qrcode-control_v11p_sd21",
torch_dtype=torch.float16)
pipe = StableDiffusionControlNetImg2ImgPipeline.from_pretrained(
"stabilityai/stable-diffusion-2-1",
controlnet=controlnet,
safety_checker=None,
torch_dtype=torch.float16
)
pipe.enable_xformers_memory_efficient_attention()
pipe.scheduler = DDIMScheduler.from_config(pipe.scheduler.config)
pipe.enable_model_cpu_offload()
def resize_for_condition_image(input_image: Image, resolution: int):
input_image = input_image.convert("RGB")
W, H = input_image.size
k = float(resolution) / min(H, W)
H *= k
W *= k
H = int(round(H / 64.0)) * 64
W = int(round(W / 64.0)) * 64
img = input_image.resize((W, H), resample=Image.LANCZOS)
return img
source_image = load_image("https://s3.amazonaws.com/moonup/production/uploads/6064e095abd8d3692e3e2ed6/A_RqHaAM6YHBodPLwqtjn.png")
init_image = load_image("https://s3.amazonaws.com/moonup/production/uploads/noauth/KfMBABpOwIuNolv1pe3qX.jpeg")
condition_image = resize_for_condition_image(source_image, 768)
init_image = resize_for_condition_image(init_image, 768)
generator = torch.manual_seed(123121231)
image = pipe(prompt="a bilboard in NYC with a qrcode",
negative_prompt="ugly, disfigured, low quality, blurry, nsfw",
image=init_image,
control_image=condition_image,
width=768,
height=768,
guidance_scale=20,
controlnet_conditioning_scale=1.5,
generator=generator,
strength=0.9,
num_inference_steps=150,
)
image.images[0]
✨ 主要特性
- 本倉庫包含適用於Stable Diffusion v2.1的二維碼條件控制網絡(ControlNet)的safetensors和diffusers版本。
- Stable Diffusion 2.1版本效果略好,它是為滿足特定需求而開發的。不過,也在相同數據集上訓練了1.5版本的模型,以滿足使用舊版本的用戶需求。
📦 安裝指南
將 .safetensors
模型及其 .yaml
配置文件放置在其他ControlNet模型的安裝文件夾中,具體文件夾因應用而異。
- 若要在auto1111中使用,可將它們放置在
webui/models/ControlNet
文件夾中。
- 可通過webui的擴展選項卡安裝ControlNet的webui擴展(https://github.com/Mikubill/sd-webui-controlnet)來加載這些模型。
- 確保啟用ControlNet單元,並將輸入圖像設置為二維碼。根據基礎的Stable Diffusion模型,選擇SD2.1或1.5版本的模型,否則會出錯。
- 無需預處理器,但可使用反轉預處理器以獲得不同的結果。建議以768的分辨率進行生成,這樣可以使最終作品具有更高的細節水平。
📚 詳細文檔
性能與侷限性
這些模型在大多數情況下表現良好,但請注意,它們並非100%準確。在某些情況下,二維碼的形狀可能無法如預期那樣呈現。你可以增加ControlNet的權重來突出二維碼的形狀,但需謹慎操作,因為這可能會對輸出的風格產生負面影響。為了優化掃描效果,請使用糾錯模式 'H' (30%) 生成二維碼。
為了在風格和形狀之間取得平衡,可能需要根據具體輸入、期望輸出以及正確的提示詞對控制權重進行微調。有些提示詞在大幅增加權重後才會生效。找到這些因素之間的最佳平衡既需要技巧也需要經驗。為了獲得最佳效果,建議以768的分辨率生成作品,這樣可以使最終產品具有更高的細節水平,提升基於二維碼的藝術作品的質量和效果。
📄 許可證
本項目採用OpenRAIL++許可證。