flash-pixart開源圖像生成模型 - 4步輕鬆生成1024x1024高質量圖像

首頁

Flash Pixart

由jasperai開發

基於PixArt-α的低秩適配蒸餾版本，僅需4步即可生成1024x1024圖像

圖像生成 #4步文生圖 #1024高清生成 #擴散蒸餾

下載量 488

發布時間 : 5/30/2024

模型概述

閃速擴散是一種擴散蒸餾方法，通過低秩適配技術大幅提升圖像生成速度，適用於快速高質量的文生圖任務。

模型特點

超快速生成

僅需4步推理即可生成1024x1024分辨率圖像

低秩適配技術

採用LoRA技術實現高效蒸餾，保持高質量輸出的同時大幅減少計算量

高分辨率支持

原生支持1024x1024高分辨率圖像生成

模型能力

文本到圖像生成

高質量圖像合成

快速推理

使用案例

創意設計

概念藝術創作

快速生成創意概念藝術圖像

4步內生成可用作品

內容創作輔助

為博客、社交媒體等快速生成配圖

高質量1024x1024圖像

產品原型

產品概念可視化

快速將產品概念轉化為視覺呈現

快速迭代設計概念

🚀 ⚡ 快速擴散：FlashPixart ⚡

Flash Diffusion是Jasper Research的Clément Chadebec、Onur Tasar、Eyal Benaroche和Benjamin Aubin在論文Flash Diffusion: Accelerating Any Conditional Diffusion Model for Few Steps Image Generation中提出的一種擴散蒸餾方法。該模型是Pixart-α模型的一個6650萬參數的LoRA蒸餾版本，能夠在4步內生成1024x1024的圖像。查看我們的即時演示和官方Github倉庫。

🚀 快速開始

本模型可以直接使用diffusers庫中的PixArtAlphaPipeline。它可以將所需的採樣步驟減少到4步。

基礎用法

import torch
from diffusers import PixArtAlphaPipeline, Transformer2DModel, LCMScheduler
from peft import PeftModel

# Load LoRA
transformer = Transformer2DModel.from_pretrained(
  "PixArt-alpha/PixArt-XL-2-1024-MS",
  subfolder="transformer",
  torch_dtype=torch.float16
)
transformer = PeftModel.from_pretrained(
  transformer,
  "jasperai/flash-pixart"
)

# Pipeline
pipe = PixArtAlphaPipeline.from_pretrained(
  "PixArt-alpha/PixArt-XL-2-1024-MS",
  transformer=transformer,
  torch_dtype=torch.float16
)

# Scheduler
pipe.scheduler = LCMScheduler.from_pretrained(
  "PixArt-alpha/PixArt-XL-2-1024-MS",
  subfolder="scheduler",
  timestep_spacing="trailing",
)

pipe.to("cuda")

prompt = "A raccoon reading a book in a lush forest."

image = pipe(prompt, num_inference_steps=4, guidance_scale=0).images[0]

🔧 技術細節

該模型在4個H100 GPU上進行了40k次迭代訓練（約188小時）。更多參數細節請參考論文。

評估指標

屬性	詳情
FID-10k	29.30 (4 NFE)
CLIP Score	0.303 (4 NFE)

📚 詳細文檔

引用

如果您覺得這項工作有用或在研究中使用了它，請考慮引用我們：

@misc{chadebec2024flash,
      title={Flash Diffusion: Accelerating Any Conditional Diffusion Model for Few Steps Image Generation}, 
      author={Clement Chadebec and Onur Tasar and Eyal Benaroche and Benjamin Aubin},
      year={2024},
      eprint={2406.02347},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}