Animagine XL開源文生圖模型 - 免費生成高質量動漫風格圖像

首頁

Animagine Xl

由Linaqruf開發

Animagine XL 是一款高分辨率潛變量文生圖擴散模型，專注於生成高質量動漫風格圖像

圖像生成英語#高分辨率動漫生成 #Danbooru標籤支持 #XL擴散模型

下載量 1,889

發布時間 : 8/4/2023

模型概述

基於Stable Diffusion XL 1.0開發的動漫風格文生圖模型，支持通過Danbooru標籤生成高分辨率圖像

模型特點

高分辨率圖像生成

模型以1024x1024分辨率訓練，支持非方形分辨率輸出

動漫風格優化

專門針對動漫風格圖像進行優化，能生成高質量的動漫人物和場景

精細調校的擴散過程

通過優化擴散流程確保輸出圖像的高質量和獨特性

模型能力

動漫風格圖像生成

高分辨率圖像生成

基於文本提示的圖像創作

使用案例

數字藝術創作

動漫角色設計

根據文本描述生成動漫角色概念圖

高質量的角色設計圖像

場景概念設計

生成動漫風格的場景概念圖

風格統一的場景圖像

🚀 Animagine XL

Animagine XL 是一款高分辨率的潛在文本到圖像擴散模型。它基於文本提示，能夠生成和修改高質量的動漫主題圖像，為動漫風格圖像創作提供了強大的支持。

🚀 快速開始

從這裡下載 Animagine XL 模型，該模型為 .safetensors 格式。
需要使用 Danbooru 風格的標籤作為提示，而非自然語言，否則生成的圖像將是寫實風格而非動漫風格。
可以使用任何通用的負面提示，或者使用以下建議的負面提示，引導模型生成具有高美學質量的圖像：

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

為了獲得高美學質量的結果，提示前應添加以下內容：

masterpiece, best quality

可以參考以下分辨率對照表，找到最佳分辨率：

768 x 1344: 豎版 (9:16)
915 x 1144: 人像 (4:5)
1024 x 1024: 方形 (1:1)
1182 x 886: 照片 (4:3)
1254 x 836: 風景 (3:2)
1365 x 768: 寬屏 (16:9)
1564 x 670: 電影寬屏 (21:9)

✨ 主要特性

高分辨率圖像：該模型以 1024x1024 分辨率進行訓練，並使用 NovelAI 寬高比分組工具進行訓練，因此也能處理非方形分辨率。
動漫風格生成：根據給定的文本提示，模型能夠創建高質量的動漫風格圖像。
精細調整的擴散過程：模型採用精細調整的擴散過程，確保輸出的圖像質量高且具有獨特性。

📚 詳細文檔

模型詳情

屬性	詳情
開發者	Linaqruf
模型類型	基於擴散的文本到圖像生成模型
模型描述	這是一個可根據文本提示生成和修改高質量動漫主題圖像的模型。
許可證	CreativeML Open RAIL++ - M 許可證
微調基礎模型	Stable Diffusion XL 1.0

使用方式

可搭配 Stable Diffusion Webui 使用。
可搭配 🧨 diffusers 使用。
推薦搭配 ComfyUI 使用。

和其他動漫風格的 Stable Diffusion 模型一樣，它也支持使用 Danbooru 標籤來生成圖像。例如：face focus, cute, masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck

Gradio 和 Colab

我們還支持使用 Gradio 網絡界面和 Colab 搭配 Diffusers 來運行 Animagine XL：

💻 使用示例

基礎用法

確保將 diffusers 升級到 >= 0.18.2：

pip install diffusers --upgrade

此外，還需安裝 transformers、safetensors、accelerate 以及隱形水印庫：

pip install invisible_watermark transformers accelerate safetensors

運行管道（如果不更換調度器，將使用默認的 EulerDiscreteScheduler，在本示例中我們將其更換為 EulerAncestralDiscreteScheduler）：

import torch
from torch import autocast
from diffusers import StableDiffusionXLPipeline, EulerAncestralDiscreteScheduler

model = "Linaqruf/animagine-xl"

pipe = StableDiffusionXLPipeline.from_pretrained(
    model, 
    torch_dtype=torch.float16, 
    use_safetensors=True, 
    variant="fp16"
    )

pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)
pipe.to('cuda')

prompt = "face focus, cute, masterpiece, best quality, 1girl, green hair, sweater, looking at viewer, upper body, beanie, outdoors, night, turtleneck"
negative_prompt = "lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry"

image = pipe(
    prompt, 
    negative_prompt=negative_prompt, 
    width=1024,
    height=1024,
    guidance_scale=12,
    target_size=(1024,1024),
    original_size=(4096,4096),
    num_inference_steps=50
    ).images[0]

image.save("anime_girl.png")