LCM_Dreamshaper_v7开源图像生成模型 - 短时间生成高质量图像！

首页

LCM Dreamshaper V7

由 SimianLuo 开发

潜在一致性模型是从Stable-Diffusion v1-5的Dreamshaper v7微调版本蒸馏而来的文本生成图像模型，能在极短推理时间内生成高质量图像。

图像生成英语开源协议:MIT #快速图像生成 #少步推理 #艺术风格创作

下载量 182.34k

发布时间 : 10/14/2023

模型简介

该模型通过将无分类器引导蒸馏至模型输入端，实现了在4-8步推理步骤下快速生成高质量图像的能力，相比原始模型大幅提升了推理速度。

模型特点

快速推理

仅需1-8步推理步骤即可生成高质量图像，相比传统模型大幅减少推理时间

高质量输出

即使在极少的推理步骤下，仍能保持图像生成的高质量

高效训练

仅需4,000次训练迭代（约32个A100 GPU小时）即可完成模型训练

模型能力

文本生成图像

快速图像合成

高质量图像生成

使用案例

创意设计

艺术创作

快速生成各种风格的艺术作品

可在几秒内生成油画、素描等风格的高质量图像

概念设计

为设计师提供快速概念可视化

快速生成设计概念图，加速设计流程

内容创作

社交媒体内容

快速生成社交媒体所需的视觉内容

高质量图像可在极短时间内生成

🚀 潜在一致性模型（Latent Consistency Models）

潜在一致性模型（Latent Consistency Models）是一个用于文本到图像生成的模型，它能在极短的推理时间内生成高质量图像，为图像生成领域带来了高效的解决方案。

🚀 快速开始

你可以直接在以下链接尝试潜在一致性模型：

若要自己运行该模型，可借助 🧨 Diffusers 库：

安装库：

pip install --upgrade diffusers  # 确保使用至少 diffusers >= 0.22
pip install transformers accelerate

运行模型：

from diffusers import DiffusionPipeline
import torch

pipe = DiffusionPipeline.from_pretrained("SimianLuo/LCM_Dreamshaper_v7")

# 为节省 GPU 内存，可使用 torch.float16，但可能会影响图像质量。
pipe.to(torch_device="cuda", torch_dtype=torch.float32)

prompt = "Self-portrait oil painting, a beautiful cyborg with golden hair, 8k"

# 可设置为 1~50 步。LCM 即使在 <= 4 步时也支持快速推理。建议：1~8 步。
num_inference_steps = 4 

images = pipe(prompt=prompt, num_inference_steps=num_inference_steps, guidance_scale=8.0, lcm_origin_steps=50, output_type="pil").images

更多信息，请查看官方文档： 👉 https://huggingface.co/docs/diffusers/api/pipelines/latent_consistency_models#latent-consistency-models

✨ 主要特性

高效推理：通过将无分类器引导蒸馏到模型输入中，LCM 能够在极短的推理时间内生成高质量图像。
轻量训练：仅用 4000 次训练迭代（约 32 个 A100 GPU 小时）从 Dreamshaper v7 微调 Stable-Diffusion v1 - 5 中提炼而来。

📚 详细文档

模型描述

该模型从 Dreamshaper v7 对 Stable-Diffusion v1 - 5 的微调版本中提炼而来，仅进行了 4000 次训练迭代（约 32 个 A100 GPU 小时）。

生成结果

通过将无分类器引导蒸馏到模型输入中，LCM 可以在极短的推理时间内生成高质量图像。我们在 768 x 768 分辨率、CFG 比例 w = 8、批量大小 = 4 的设置下，使用 A800 GPU 比较了推理时间。

旧版使用方法

安装库：

pip install diffusers transformers accelerate

运行模型：

from diffusers import DiffusionPipeline
import torch

pipe = DiffusionPipeline.from_pretrained("SimianLuo/LCM_Dreamshaper_v7", custom_pipeline="latent_consistency_txt2img", custom_revision="main", revision="fb9c5d")

# 为节省 GPU 内存，可使用 torch.float16，但可能会影响图像质量。
pipe.to(torch_device="cuda", torch_dtype=torch.float32)

prompt = "Self-portrait oil painting, a beautiful cyborg with golden hair, 8k"

# 可设置为 1~50 步。LCM 即使在 <= 4 步时也支持快速推理。建议：1~8 步。
num_inference_steps = 4 

images = pipe(prompt=prompt, num_inference_steps=num_inference_steps, guidance_scale=8.0, output_type="pil").images

📄 许可证

本项目采用 MIT 许可证。

📖 引用

@misc{luo2023latent,
      title={Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference}, 
      author={Simian Luo and Yiqin Tan and Longbo Huang and Jian Li and Hang Zhao},
      year={2023},
      eprint={2310.04378},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}