lcm-sdxl开源AI模型 - 快速图像推理，2

首页

Lcm Sdxl

由 latent-consistency 开发

基于Stable Diffusion XL的潜在一致性模型，可将推理步骤缩减至2-8步

图像生成 #极速文生图 #少步推理 #SDXL优化

下载量 882

发布时间 : 11/7/2023

模型简介

这是对stable-diffusion-xl-base-1.0进行LCM蒸馏后的版本，显著减少了图像生成所需的推理步骤，同时保持高质量输出。

模型特点

快速推理

通过LCM蒸馏技术，将推理步骤从传统SDXL的25-50步缩减至仅需2-8步

高质量输出

在极少的推理步骤下仍能保持与原始SDXL相当的图像质量

多功能支持

支持文生图、图生图、图像修复、ControlNet控制和T2I适配器等多项功能

模型能力

文本到图像生成

图像到图像转换

图像修复

可控图像生成

使用案例

创意设计

概念艺术创作

快速生成高质量的概念艺术图像

在4步推理内生成可用作品

商业应用

广告素材生成

快速迭代广告创意视觉内容

大幅缩短创意产出时间

🚀 潜在一致性模型 (LCM): SDXL

潜在一致性模型（Latent Consistency Model，LCM）由 Simian Luo、Yiqin Tan 等人 在论文潜在一致性模型：通过少步推理合成高分辨率图像中提出。Simian Luo、Suraj Patil 和 Daniel Gu 成功地将相同方法应用于为 SDXL 创建 LCM。

此检查点是 stable-diffusion-xl-base-1.0 的 LCM 蒸馏版本，它允许将推理步骤数减少到仅 2 - 8 步。

🚀 快速开始

LCM SDXL 从 🤗 Hugging Face Diffusers 库的 v0.23.0 版本开始得到支持。要运行该模型，首先需要安装最新版本的 Diffusers 库以及 peft、accelerate 和 transformers。可以从 Hugging Face Hub 安装：

pip install --upgrade pip
pip install --upgrade diffusers transformers accelerate peft

✨ 主要特性

基于潜在一致性模型（LCM），能够大幅减少推理步骤，在 2 - 8 步内合成高分辨率图像。
支持文本到图像、图像到图像、图像修复、ControlNet 和 T2I Adapter 等多种应用场景。

📦 安装指南

要运行 LCM SDXL 模型，需要安装最新版本的 Diffusers 库以及相关依赖：

pip install --upgrade pip
pip install --upgrade diffusers transformers accelerate peft

💻 使用示例

基础用法

文本到图像

模型可以使用其基础管道 stabilityai/stable-diffusion-xl-base-1.0 加载。接下来，需要将调度器更改为 LCMScheduler，并且可以将推理步骤数减少到仅 2 到 8 步。请确保禁用 guidance_scale 或使用 1.0 到 2.0 之间的值。

from diffusers import UNet2DConditionModel, DiffusionPipeline, LCMScheduler
import torch

unet = UNet2DConditionModel.from_pretrained("latent-consistency/lcm-sdxl", torch_dtype=torch.float16, variant="fp16")
pipe = DiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-xl-base-1.0", unet=unet, torch_dtype=torch.float16, variant="fp16")

pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config)
pipe.to("cuda")

prompt = "a close-up picture of an old man standing in the rain"

image = pipe(prompt, num_inference_steps=4, guidance_scale=8.0).images[0]