🚀 Animagine XL
Animagine XL 是一款高分辨率的潜在文本到图像扩散模型。它基于文本提示,能够生成和修改高质量的动漫主题图像,为动漫风格图像创作提供了强大的支持。
🚀 快速开始
- 从 这里 下载
Animagine XL
模型,该模型为 .safetensors
格式。
- 需要使用 Danbooru 风格的标签作为提示,而非自然语言,否则生成的图像将是写实风格而非动漫风格。
- 可以使用任何通用的负面提示,或者使用以下建议的负面提示,引导模型生成具有高美学质量的图像:
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry
masterpiece, best quality
768 x 1344: 竖版 (9:16)
915 x 1144: 人像 (4:5)
1024 x 1024: 方形 (1:1)
1182 x 886: 照片 (4:3)
1254 x 836: 风景 (3:2)
1365 x 768: 宽屏 (16:9)
1564 x 670: 电影宽屏 (21:9)
✨ 主要特性
- 高分辨率图像:该模型以 1024x1024 分辨率进行训练,并使用 NovelAI 宽高比分组工具 进行训练,因此也能处理非方形分辨率。
- 动漫风格生成:根据给定的文本提示,模型能够创建高质量的动漫风格图像。
- 精细调整的扩散过程:模型采用精细调整的扩散过程,确保输出的图像质量高且具有独特性。
📚 详细文档
模型详情
使用方式
和其他动漫风格的 Stable Diffusion 模型一样,它也支持使用 Danbooru 标签来生成图像。例如:face focus, cute, masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck
Gradio 和 Colab
我们还支持使用 Gradio 网络界面和 Colab 搭配 Diffusers 来运行 Animagine XL:

💻 使用示例
基础用法
确保将 diffusers 升级到 >= 0.18.2:
pip install diffusers --upgrade
此外,还需安装 transformers
、safetensors
、accelerate
以及隐形水印库:
pip install invisible_watermark transformers accelerate safetensors
运行管道(如果不更换调度器,将使用默认的 EulerDiscreteScheduler,在本示例中我们将其更换为 EulerAncestralDiscreteScheduler):
import torch
from torch import autocast
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
model = "Linaqruf/animagine-xl"
pipe = StableDiffusionXLPipeline.from_pretrained(
model,
torch_dtype=torch.float16,
use_safetensors=True,
variant="fp16"
)
pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)
pipe.to('cuda')
prompt = "face focus, cute, masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck"
negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=1024,
height=1024,
guidance_scale=12,
target_size=(1024,1024),
original_size=(4096,4096),
num_inference_steps=50
).images[0]
image.save("anime_girl.png")
🔧 技术细节
该模型继承了 Stable Diffusion XL 1.0 的 局限性。
📄 许可证
本模型使用 CreativeML Open RAIL++ - M 许可证。