Animagine XL开源文生图模型 - 免费生成高质量动漫风格图像

首页

Animagine Xl

由 Linaqruf 开发

Animagine XL 是一款高分辨率潜变量文生图扩散模型，专注于生成高质量动漫风格图像

图像生成英语#高分辨率动漫生成 #Danbooru标签支持 #XL扩散模型

下载量 1,889

发布时间 : 8/4/2023

模型简介

基于Stable Diffusion XL 1.0开发的动漫风格文生图模型，支持通过Danbooru标签生成高分辨率图像

模型特点

高分辨率图像生成

模型以1024x1024分辨率训练，支持非方形分辨率输出

动漫风格优化

专门针对动漫风格图像进行优化，能生成高质量的动漫人物和场景

精细调校的扩散过程

通过优化扩散流程确保输出图像的高质量和独特性

模型能力

动漫风格图像生成

高分辨率图像生成

基于文本提示的图像创作

使用案例

数字艺术创作

动漫角色设计

根据文本描述生成动漫角色概念图

高质量的角色设计图像

场景概念设计

生成动漫风格的场景概念图

风格统一的场景图像

🚀 Animagine XL

Animagine XL 是一款高分辨率的潜在文本到图像扩散模型。它基于文本提示，能够生成和修改高质量的动漫主题图像，为动漫风格图像创作提供了强大的支持。

🚀 快速开始

从这里下载 Animagine XL 模型，该模型为 .safetensors 格式。
需要使用 Danbooru 风格的标签作为提示，而非自然语言，否则生成的图像将是写实风格而非动漫风格。
可以使用任何通用的负面提示，或者使用以下建议的负面提示，引导模型生成具有高美学质量的图像：

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

为了获得高美学质量的结果，提示前应添加以下内容：

masterpiece, best quality

可以参考以下分辨率对照表，找到最佳分辨率：

768 x 1344: 竖版 (9:16)
915 x 1144: 人像 (4:5)
1024 x 1024: 方形 (1:1)
1182 x 886: 照片 (4:3)
1254 x 836: 风景 (3:2)
1365 x 768: 宽屏 (16:9)
1564 x 670: 电影宽屏 (21:9)

✨ 主要特性

高分辨率图像：该模型以 1024x1024 分辨率进行训练，并使用 NovelAI 宽高比分组工具进行训练，因此也能处理非方形分辨率。
动漫风格生成：根据给定的文本提示，模型能够创建高质量的动漫风格图像。
精细调整的扩散过程：模型采用精细调整的扩散过程，确保输出的图像质量高且具有独特性。

📚 详细文档

模型详情

属性	详情
开发者	Linaqruf
模型类型	基于扩散的文本到图像生成模型
模型描述	这是一个可根据文本提示生成和修改高质量动漫主题图像的模型。
许可证	CreativeML Open RAIL++ - M 许可证
微调基础模型	Stable Diffusion XL 1.0

使用方式

可搭配 Stable Diffusion Webui 使用。
可搭配 🧨 diffusers 使用。
推荐搭配 ComfyUI 使用。

和其他动漫风格的 Stable Diffusion 模型一样，它也支持使用 Danbooru 标签来生成图像。例如：face focus, cute, masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck

Gradio 和 Colab

我们还支持使用 Gradio 网络界面和 Colab 搭配 Diffusers 来运行 Animagine XL：

💻 使用示例

基础用法

确保将 diffusers 升级到 >= 0.18.2：

pip install diffusers --upgrade

此外，还需安装 transformers、safetensors、accelerate 以及隐形水印库：

pip install invisible_watermark transformers accelerate safetensors

运行管道（如果不更换调度器，将使用默认的 EulerDiscreteScheduler，在本示例中我们将其更换为 EulerAncestralDiscreteScheduler）：

import torch
from torch import autocast
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler

model = "Linaqruf/animagine-xl"

pipe = StableDiffusionXLPipeline.from_pretrained(
    model, 
    torch_dtype=torch.float16, 
    use_safetensors=True, 
    variant="fp16"
    )

pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)
pipe.to('cuda')

prompt = "face focus, cute, masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck"
negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"

image = pipe(
    prompt, 
    negative_prompt=negative_prompt, 
    width=1024,
    height=1024,
    guidance_scale=12,
    target_size=(1024,1024),
    original_size=(4096,4096),
    num_inference_steps=50
    ).images[0]

image.save("anime_girl.png")