sdxl - instructpix2pix - 768开源图像编辑模型，用自然语言指令编辑图像超方便

首页

Sdxl Instructpix2pix 768

由 diffusers 开发

基于Stable Diffusion XL (SDXL)进行指令微调的图像编辑模型，采用InstructPix2Pix方法，支持通过自然语言指令编辑图像。

图像生成 #图像指令编辑 #SDXL微调 #艺术风格转换

下载量 15.88k

发布时间 : 8/23/2023

模型简介

该模型是对Stable Diffusion XL (SDXL)进行指令微调的版本，专门用于根据文本指令编辑图像。它能够理解自然语言指令并相应地修改输入图像，如改变风格、调整内容等。

模型特点

自然语言图像编辑

能够理解自然语言指令并相应地修改输入图像

高分辨率处理

支持768x768分辨率的图像编辑

多样编辑能力

支持风格转换、内容修改等多种编辑任务

模型能力

图像编辑

风格转换

内容修改

自然语言理解

使用案例

创意设计

艺术风格转换

将普通照片转换为毕加索等艺术风格

示例显示成功将图像转换为毕加索风格

场景修改

修改图像中的特定元素，如改变天空状态

示例显示成功将晴朗天空变为多云

人物编辑

年龄变化

调整人物年龄表现

示例显示成功使人物看起来更老

🚀 SDXL InstructPix2Pix (768768)

本项目基于InstructPix2Pix的方法，对Stable Diffusion XL (SDXL)进行指令微调。以下是一些生成结果示例：

编辑指令："将天空变为多云的样子"

编辑指令："将其变成毕加索风格的画作"

编辑指令："让人物看起来更老一些"

🚀 快速开始

📦 安装指南

在使用之前，请确保安装所需的库：

pip install accelerate transformers
pip install git+https://github.com/huggingface/diffusers

💻 使用示例

基础用法

import torch
from diffusers import StableDiffusionXLInstructPix2PixPipeline
from diffusers.utils import load_image

resolution = 768
image = load_image(
    "https://hf.co/datasets/diffusers/diffusers-images-docs/resolve/main/mountain.png"
).resize((resolution, resolution))
edit_instruction = "Turn sky into a cloudy one"

pipe = StableDiffusionXLInstructPix2PixPipeline.from_pretrained(
    "diffusers/sdxl-instructpix2pix-768", torch_dtype=torch.float16
).to("cuda")

edited_image = pipe(
    prompt=edit_instruction,
    image=image,
    height=resolution,
    width=resolution,
    guidance_scale=3.0,
    image_guidance_scale=1.5,
    num_inference_steps=30,
).images[0]
edited_image.save("edited_image.png")

更多详细信息，请参考文档。

⚠️ 重要提示

此检查点本质上是实验性的，有很大的改进空间。请使用本仓库的“讨论”标签来提出问题和进行讨论。

🔧 技术细节

训练

我们使用InstructPix2Pix训练方法对SDXL进行了15000步的微调，在768x768的图像分辨率上使用了固定学习率5e - 6。

我们的训练脚本和其他实用工具可以在这里找到，它们是基于我们的官方训练脚本构建的。

我们的训练日志可以在Weights and Biases上查看这里。请参考此链接了解所有超参数的详细信息。

训练数据

我们使用了这个数据集：timbrooks/instructpix2pix-clip-filtered。

计算资源

使用一台配备8张A100显卡的机器。

批量大小

采用数据并行，单GPU批量大小为8，总批量大小为32。

混合精度

使用FP16。

📄 许可证

本项目采用OpenRAIL++许可证。

信息表格

属性	详情
基础模型	stabilityai/stable-diffusion-xl-base-1.0
标签	stable-diffusion-xl、stable-diffusion-xl-diffusers、text-to-image、diffusers、instruct-pix2pix
推理	否
数据集	timbrooks/instructpix2pix-clip-filtered
许可证	OpenRAIL++