lcm-lora-ssd-1b開源模型 - 加速segmind/SSD-1B推理，僅需2

首頁

Lcm Lora Ssd 1b

由latent-consistency開發

為segmind/SSD-1B設計的蒸餾一致性適配器，可將推理步驟減少至僅需2-8步

文本生成圖像 #極速推理 #文本生成圖像 #LoRA微調

下載量 1,512

發布時間 : 11/9/2023

模型概述

潛在一致性模型(LCM) LoRA是一種通用穩定擴散加速模塊，專為segmind/SSD-1B模型設計，能夠顯著減少文本生成圖像任務的推理步驟。

模型特點

高效推理

可將推理步驟減少至僅需2-8步，顯著提高生成速度

兼容性強

專為segmind/SSD-1B設計，但原理可應用於其他穩定擴散模型

輕量級適配

採用LoRA技術，只需少量參數即可實現模型加速

模型能力

文本生成圖像

圖像生成圖像

圖像修復

ControlNet控制

T2I適配器

使用案例

藝術創作

快速概念藝術生成

藝術家可以快速生成多種概念藝術方案

在4步推理內生成高質量概念圖

設計輔助

產品設計可視化

設計師可以快速將文字描述轉化為視覺呈現

快速迭代設計方案

🚀 潛在一致性模型（LCM）LoRA：SSD - 1B

潛在一致性模型（LCM）LoRA 是一種用於文本到圖像生成的高效加速模塊。它能顯著減少推理步驟，提升圖像生成效率，為文本到圖像的生成任務帶來了更快速的解決方案。

🚀 快速開始

潛在一致性模型（LCM）LoRA 在論文 LCM - LoRA: A universal Stable - Diffusion Acceleration Module 中被提出，作者為 Simian Luo、Yiqin Tan、Suraj Patil、Daniel Gu 等人。它是針對 [segmind/SSD - 1B](https://huggingface.co/segmind/SSD - 1B) 的蒸餾一致性適配器，可將推理步驟減少至僅 2 - 8 步。

模型	參數 / M
[lcm - lora - sdv1 - 5](https://huggingface.co/latent - consistency/lcm - lora - sdv1 - 5)	67.5
[lcm - lora - ssd - 1b](https://huggingface.co/latent - consistency/lcm - lora - ssd - 1b)	105
[lcm - lora - sdxl](https://huggingface.co/latent - consistency/lcm - lora - sdxl)	197M

📦 安裝指南

LCM - LoRA 在 🤗 Hugging Face Diffusers 庫的 v0.23.0 及更高版本中得到支持。要運行該模型，首先需要安裝最新版本的 Diffusers 庫以及 peft、accelerate 和 transformers。可以使用以下命令進行安裝：

pip install --upgrade pip
pip install --upgrade diffusers transformers accelerate peft

💻 使用示例

基礎用法 - 文本到圖像

首先，我們需要加載基礎模型 segmind/SSD - 1B。接著，將調度器更改為 LCMScheduler，這樣就可以將推理步驟減少到 2 到 8 步。請確保禁用 guidance_scale 或使用 1.0 到 2.0 之間的值。

import torch
from diffusers import LCMScheduler, AutoPipelineForText2Image

model_id = "segmind/SSD-1B"
adapter_id = "latent-consistency/lcm-lora-ssd-1b"

pipe = AutoPipelineForText2Image.from_pretrained(model_id, torch_dtype=torch.float16, variant="fp16")
pipe.scheduler = LCMScheduler.from_config(pipe.scheduler.config)
pipe.to("cuda")

# load and fuse lcm lora
pipe.load_lora_weights(adapter_id)
pipe.fuse_lora()


prompt = "Self-portrait oil painting, a beautiful cyborg with golden hair, 8k"

# disable guidance_scale by passing 0
image = pipe(prompt=prompt, num_inference_steps=4, guidance_scale=0).images[0]