🚀 Animagine XL
Animagine XL 是一款高分辨率的潛在文本到圖像擴散模型。它基於文本提示,能夠生成和修改高質量的動漫主題圖像,為動漫風格圖像創作提供了強大的支持。
🚀 快速開始
- 從 這裡 下載
Animagine XL
模型,該模型為 .safetensors
格式。
- 需要使用 Danbooru 風格的標籤作為提示,而非自然語言,否則生成的圖像將是寫實風格而非動漫風格。
- 可以使用任何通用的負面提示,或者使用以下建議的負面提示,引導模型生成具有高美學質量的圖像:
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry
masterpiece, best quality
768 x 1344: 豎版 (9:16)
915 x 1144: 人像 (4:5)
1024 x 1024: 方形 (1:1)
1182 x 886: 照片 (4:3)
1254 x 836: 風景 (3:2)
1365 x 768: 寬屏 (16:9)
1564 x 670: 電影寬屏 (21:9)
✨ 主要特性
- 高分辨率圖像:該模型以 1024x1024 分辨率進行訓練,並使用 NovelAI 寬高比分組工具 進行訓練,因此也能處理非方形分辨率。
- 動漫風格生成:根據給定的文本提示,模型能夠創建高質量的動漫風格圖像。
- 精細調整的擴散過程:模型採用精細調整的擴散過程,確保輸出的圖像質量高且具有獨特性。
📚 詳細文檔
模型詳情
使用方式
和其他動漫風格的 Stable Diffusion 模型一樣,它也支持使用 Danbooru 標籤來生成圖像。例如:face focus, cute, masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck
Gradio 和 Colab
我們還支持使用 Gradio 網絡界面和 Colab 搭配 Diffusers 來運行 Animagine XL:

💻 使用示例
基礎用法
確保將 diffusers 升級到 >= 0.18.2:
pip install diffusers --upgrade
此外,還需安裝 transformers
、safetensors
、accelerate
以及隱形水印庫:
pip install invisible_watermark transformers accelerate safetensors
運行管道(如果不更換調度器,將使用默認的 EulerDiscreteScheduler,在本示例中我們將其更換為 EulerAncestralDiscreteScheduler):
import torch
from torch import autocast
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler
model = "Linaqruf/animagine-xl"
pipe = StableDiffusionXLPipeline.from_pretrained(
model,
torch_dtype=torch.float16,
use_safetensors=True,
variant="fp16"
)
pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)
pipe.to('cuda')
prompt = "face focus, cute, masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck"
negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=1024,
height=1024,
guidance_scale=12,
target_size=(1024,1024),
original_size=(4096,4096),
num_inference_steps=50
).images[0]
image.save("anime_girl.png")
🔧 技術細節
該模型繼承了 Stable Diffusion XL 1.0 的 侷限性。
📄 許可證
本模型使用 CreativeML Open RAIL++ - M 許可證。