lcm-sdxl開源AI模型 - 快速圖像推理，2

首頁

Lcm Sdxl

由latent-consistency開發

基於Stable Diffusion XL的潛在一致性模型，可將推理步驟縮減至2-8步

圖像生成 #極速文生圖 #少步推理 #SDXL優化

下載量 882

發布時間 : 11/7/2023

模型概述

這是對stable-diffusion-xl-base-1.0進行LCM蒸餾後的版本，顯著減少了圖像生成所需的推理步驟，同時保持高質量輸出。

模型特點

快速推理

通過LCM蒸餾技術，將推理步驟從傳統SDXL的25-50步縮減至僅需2-8步

高質量輸出

在極少的推理步驟下仍能保持與原始SDXL相當的圖像質量

多功能支持

支持文生圖、圖生圖、圖像修復、ControlNet控制和T2I適配器等多項功能

模型能力

文本到圖像生成

圖像到圖像轉換

圖像修復

可控圖像生成

使用案例

創意設計

概念藝術創作

快速生成高質量的概念藝術圖像

在4步推理內生成可用作品

商業應用

廣告素材生成

快速迭代廣告創意視覺內容

大幅縮短創意產出時間

🚀 潛在一致性模型 (LCM): SDXL

潛在一致性模型（Latent Consistency Model，LCM）由 Simian Luo、Yiqin Tan 等人 在論文潛在一致性模型：通過少步推理合成高分辨率圖像中提出。Simian Luo、Suraj Patil 和 Daniel Gu 成功地將相同方法應用於為 SDXL 創建 LCM。

此檢查點是 stable-diffusion-xl-base-1.0 的 LCM 蒸餾版本，它允許將推理步驟數減少到僅 2 - 8 步。

🚀 快速開始

LCM SDXL 從 🤗 Hugging Face Diffusers 庫的 v0.23.0 版本開始得到支持。要運行該模型，首先需要安裝最新版本的 Diffusers 庫以及 peft、accelerate 和 transformers。可以從 Hugging Face Hub 安裝：

pip install --upgrade pip
pip install --upgrade diffusers transformers accelerate peft

✨ 主要特性

基於潛在一致性模型（LCM），能夠大幅減少推理步驟，在 2 - 8 步內合成高分辨率圖像。
支持文本到圖像、圖像到圖像、圖像修復、ControlNet 和 T2I Adapter 等多種應用場景。

📦 安裝指南

要運行 LCM SDXL 模型，需要安裝最新版本的 Diffusers 庫以及相關依賴：

pip install --upgrade pip
pip install --upgrade diffusers transformers accelerate peft

💻 使用示例

基礎用法

文本到圖像

模型可以使用其基礎管道 stabilityai/stable-diffusion-xl-base-1.0 加載。接下來，需要將調度器更改為 LCMScheduler，並且可以將推理步驟數減少到僅 2 到 8 步。請確保禁用 guidance_scale 或使用 1.0 到 2.0 之間的值。

from diffusers import UNet2DConditionModel, DiffusionPipeline, LCMScheduler
import torch

unet = UNet2DConditionModel.from_pretrained("latent-consistency/lcm-sdxl", torch_dtype=torch.float16, variant="fp16")
pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", unet=unet, torch_dtype=torch.float16, variant="fp16")

pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config)
pipe.to("cuda")

prompt = "a close-up picture of an old man standing in the rain"

image = pipe(prompt, num_inference_steps=4, guidance_scale=8.0).images[0]