SDXL - Turbo開源文生圖模型 - 單次推理快速生成逼真圖像

首頁

Stable Diffusion Xl 1.0 Turbo GGUF

由gpustack開發

SDXL-Turbo是一款快速文生圖模型，僅需單次網絡推理即可根據文本提示生成逼真圖像，專為即時合成優化。

圖像生成開源協議:其他 #即時文生圖 #單步推理 #對抗蒸餾

下載量 278

發布時間 : 11/10/2024

模型概述

基於SDXL 1.0的蒸餾版本，採用對抗擴散蒸餾訓練法(ADD)，可在1-4步採樣內保持高質量圖像輸出。適用於即時圖像生成應用。

模型特點

即時圖像生成

僅需1次網絡推理即可生成高質量圖像，適合即時應用場景

對抗擴散蒸餾訓練

採用新型ADD訓練方法，結合分數蒸餾和對抗損失，確保低步數採樣下的圖像質量

高分辨率支持

默認生成512x512分辨率圖像，支持更高分辨率輸出

模型能力

文本到圖像生成

圖像到圖像轉換

即時圖像合成

使用案例

創意設計

藝術創作

根據文本描述快速生成藝術作品

高質量藝術圖像

概念設計

為產品設計快速生成概念圖

多樣化設計方案

教育工具

創意教學

用於藝術和設計課程的創意激發工具

即時可視化教學內容

🚀 stable-diffusion-xl-1.0-turbo-GGUF

stable-diffusion-xl-1.0-turbo-GGUF 是一個文本到圖像的生成模型，基於 SDXL-Turbo 進行 GGUF 量化。它能快速根據文本提示合成逼真圖像，支持特定版本的 llama-box。

🚀 快速開始

此模型僅由 gpustack/llama-box v0.0.75+ 實驗性支持！

若要開始使用該模型，可查看 https://github.com/Stability-AI/generative-models 。

✨ 主要特性

快速生成：SDXL-Turbo 是快速的文本到圖像生成模型，能在單次網絡評估中根據文本提示合成逼真圖像。
多種量化支持：提供 FP16、Q8_0、Q4_1、Q4_0 等多種量化方式。
即時演示：可通過即時演示體驗。

📦 安裝指南

安裝依賴

pip install diffusers transformers accelerate --upgrade

💻 使用示例

基礎用法

文本到圖像

SDXL-Turbo 不使用 guidance_scale 或 negative_prompt，通過 guidance_scale=0.0 禁用。模型優選生成 512x512 大小的圖像，但更高尺寸也適用，單步即可生成高質量圖像。

from diffusers import AutoPipelineForText2Image
import torch

pipe = AutoPipelineForText2Image.from_pretrained("stabilityai/sdxl-turbo", torch_dtype=torch.float16, variant="fp16")
pipe.to("cuda")

prompt = "A cinematic shot of a baby racoon wearing an intricate italian priest robe."

image = pipe(prompt=prompt, num_inference_steps=1, guidance_scale=0.0).images[0]

圖像到圖像

使用 SDXL-Turbo 進行圖像到圖像生成時，確保 num_inference_steps * strength 大於或等於 1。圖像到圖像管道將運行 int(num_inference_steps * strength) 步。

from diffusers import AutoPipelineForImage2Image
from diffusers.utils import load_image
import torch

pipe = AutoPipelineForImage2Image.from_pretrained("stabilityai/sdxl-turbo", torch_dtype=torch.float16, variant="fp16")
pipe.to("cuda")

init_image = load_image("https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/diffusers/cat.png").resize((512, 512))

prompt = "cat wizard, gandalf, lord of the rings, detailed, fantasy, cute, adorable, Pixar, Disney, 8k"

image = pipe(prompt, image=init_image, num_inference_steps=2, strength=0.5, guidance_scale=0.0).images[0]

📚 詳細文檔

模型詳情

模型描述

SDXL-Turbo 是 SDXL 1.0 的蒸餾版本，專為即時合成訓練。它基於名為對抗擴散蒸餾（ADD）的新型訓練方法（參見技術報告），允許在 1 到 4 步內以高圖像質量對大規模基礎圖像擴散模型進行採樣。

開發者：Stability AI
資助方：Stability AI
模型類型：生成式文本到圖像模型
微調基礎模型：SDXL 1.0 Base

模型來源

用於研究目的，推薦使用 generative-models GitHub 倉庫，該倉庫實現了最流行的擴散框架（包括訓練和推理）。

倉庫：https://github.com/Stability-AI/generative-models
論文：https://stability.ai/research/adversarial-diffusion-distillation
演示：http://clipdrop.co/stable-diffusion-turbo

評估

comparison1 comparison2 上述圖表評估了用戶對 SDXL-Turbo 相對於其他單步和多步模型的偏好。在圖像質量和遵循提示方面，單步評估的 SDXL-Turbo 比四步（或更少）評估的 LCM-XL 更受人類投票者青睞。此外，SDXL-Turbo 使用四步進一步提高了性能。用戶研究詳情可參考研究論文。