flash-pixart开源图像生成模型 - 4步轻松生成1024x1024高质量图像

首页

Flash Pixart

由 jasperai 开发

基于PixArt-α的低秩适配蒸馏版本，仅需4步即可生成1024x1024图像

图像生成 #4步文生图 #1024高清生成 #扩散蒸馏

下载量 488

发布时间 : 5/30/2024

模型简介

闪速扩散是一种扩散蒸馏方法，通过低秩适配技术大幅提升图像生成速度，适用于快速高质量的文生图任务。

模型特点

超快速生成

仅需4步推理即可生成1024x1024分辨率图像

低秩适配技术

采用LoRA技术实现高效蒸馏，保持高质量输出的同时大幅减少计算量

高分辨率支持

原生支持1024x1024高分辨率图像生成

模型能力

文本到图像生成

高质量图像合成

快速推理

使用案例

创意设计

概念艺术创作

快速生成创意概念艺术图像

4步内生成可用作品

内容创作辅助

为博客、社交媒体等快速生成配图

高质量1024x1024图像

产品原型

产品概念可视化

快速将产品概念转化为视觉呈现

快速迭代设计概念

🚀 ⚡ 快速扩散：FlashPixart ⚡

Flash Diffusion是Jasper Research的Clément Chadebec、Onur Tasar、Eyal Benaroche和Benjamin Aubin在论文Flash Diffusion: Accelerating Any Conditional Diffusion Model for Few Steps Image Generation中提出的一种扩散蒸馏方法。该模型是Pixart-α模型的一个6650万参数的LoRA蒸馏版本，能够在4步内生成1024x1024的图像。查看我们的实时演示和官方Github仓库。

🚀 快速开始

本模型可以直接使用diffusers库中的PixArtAlphaPipeline。它可以将所需的采样步骤减少到4步。

基础用法

import torch
from diffusers import PixArtAlphaPipeline, Transformer2DModel, LCMScheduler
from peft import PeftModel

# Load LoRA
transformer = Transformer2DModel.from_pretrained(
  "PixArt-alpha/PixArt-XL-2-1024-MS",
  subfolder="transformer",
  torch_dtype=torch.float16
)
transformer = PeftModel.from_pretrained(
  transformer,
  "jasperai/flash-pixart"
)

# Pipeline
pipe = PixArtAlphaPipeline.from_pretrained(
  "PixArt-alpha/PixArt-XL-2-1024-MS",
  transformer=transformer,
  torch_dtype=torch.float16
)

# Scheduler
pipe.scheduler = LCMScheduler.from_pretrained(
  "PixArt-alpha/PixArt-XL-2-1024-MS",
  subfolder="scheduler",
  timestep_spacing="trailing",
)

pipe.to("cuda")

prompt = "A raccoon reading a book in a lush forest."

image = pipe(prompt, num_inference_steps=4, guidance_scale=0).images[0]

🔧 技术细节

该模型在4个H100 GPU上进行了40k次迭代训练（约188小时）。更多参数细节请参考论文。

评估指标

属性	详情
FID-10k	29.30 (4 NFE)
CLIP Score	0.303 (4 NFE)

📚 详细文档

引用

如果您觉得这项工作有用或在研究中使用了它，请考虑引用我们：

@misc{chadebec2024flash,
      title={Flash Diffusion: Accelerating Any Conditional Diffusion Model for Few Steps Image Generation}, 
      author={Clement Chadebec and Onur Tasar and Eyal Benaroche and Benjamin Aubin},
      year={2024},
      eprint={2406.02347},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}