🚀 Kivotos XL 2.0
Kivotos XL 2.0 是 Yodayo Kivotos XL 系列的最新版本,它基于 Animagine XL V3 这一专门用于生成高质量动漫风格艺术作品的 SDXL 模型构建。经过额外的微调与优化,该模型专注于生成能够精准呈现《蔚蓝档案》系列视觉风格与美学的图像。
🚀 快速开始
本模型支持多种使用方式:
- 在我们的平台上使用此模型:

- 在
ComfyUI
或 Stable Diffusion Webui
中使用
- 使用 🧨
diffusers
库进行使用
✨ 主要特性
- 基于 Animagine XL V3 构建,专为生成高质量动漫风格艺术作品而设计。
- 经过额外微调与优化,专注于生成符合《蔚蓝档案》系列视觉风格与美学的图像。
- 继承了 Animagine XL 3.1 的特殊标签,可提升图像生成效果。
📦 安装指南
首先安装所需的库:
pip install diffusers transformers accelerate safetensors --upgrade
💻 使用示例
基础用法
import torch
from diffusers import StableDiffusionXLPipeline
pipe = StableDiffusionXLPipeline.from_pretrained(
"yodayo-ai/kivotos-xl-2.0",
torch_dtype=torch.float16,
use_safetensors=True,
custom_pipeline="lpw_stable_diffusion_xl",
add_watermarker=False,
variant="fp16"
)
pipe.to('cuda')
prompt = "1girl, kazusa \(blue archive\), blue archive, solo, upper body, v, smile, looking at viewer, outdoors, night, masterpiece, best quality, very aesthetic, absurdres"
negative_prompt = "nsfw, (low quality, worst quality:1.2), very displeasing, 3d, watermark, signature, ugly, poorly drawn"
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=832,
height=1216,
guidance_scale=7,
num_inference_steps=28
).images[0]
image.save("./cat.png")
📚 详细文档
标签顺序
为获得最佳效果,建议遵循以下结构化提示模板,因为模型是按照此方式进行训练的:
1girl/1boy, 角色名称, 所属系列, 艺术家, 其他任意顺序的内容。
特殊标签
Kivotos XL 2.0 继承了 Animagine XL 3.1 的特殊标签,可通过引导结果朝向质量、评级、创作日期和美学方向来增强图像生成效果。即使不使用这些标签,模型也能生成图像,但使用它们有助于获得更好的结果。
- 质量标签:masterpiece, best quality, great quality, good quality, normal quality, low quality, worst quality
- 评级标签:safe, sensitive, nsfw, explicit
- 年份标签:newest, recent, mid, early, oldest
- 美学标签:very aesthetic, aesthetic, displeasing, very displeasing
推荐设置
为引导模型生成高美学的图像,建议使用以下设置:
nsfw, (low quality, worst quality:1.2), very displeasing, 3d, watermark, signature, ugly, poorly drawn
masterpiece, best quality, very aesthetic, absurdres
- 无分类器引导(CFG)比例:建议在 5 到 7 之间;10 会使图像效果过度,大于 12 则会严重失真。
- 采样步数:建议在 25 到 30 之间;28 是最佳值。
- 采样器:强烈推荐使用 Euler Ancestral (Euler a)。
- 支持的分辨率:
1024 x 1024, 1152 x 896, 896 x 1152, 1216 x 832, 832 x 1216, 1344 x 768, 768 x 1344, 1536 x 640, 640 x 1536
🔧 技术细节
以下是训练期间使用的关键超参数:
属性 |
预训练 |
微调 |
硬件 |
2x H100 80GB PCIe |
1x A100 80GB PCIe |
批量大小 |
32 |
48 |
梯度累积步数 |
2 |
1 |
噪声偏移 |
无 |
0.0357 |
训练轮数 |
10 |
10 |
UNet 学习率 |
5e-6 |
3.75e-6 |
文本编码器学习率 |
2.5e-6 |
无 |
优化器 |
Adafactor |
Adafactor |
优化器参数 |
Scale Parameter: False, Relative Step: False, Warmup Init: False (0.9, 0.99) |
Scale Parameter: False, Relative Step: False, Warmup Init: False |
调度器 |
Constant with Warmups |
Constant with Warmups |
热身步数 |
0.05% |
0.05% |
📄 许可证
Kivotos XL 2.0 遵循 Fair AI Public License 1.0-SD 许可证,该许可证与 Stable Diffusion 模型的许可证兼容。关键要点如下:
- 修改共享:如果对 Kivotos XL 2.0 进行了修改,必须同时共享修改内容和原始许可证。
- 源代码可访问性:如果修改后的版本可通过网络访问,需提供一种方式(如下载链接)让他人获取源代码。这也适用于派生模型。
- 分发条款:任何分发都必须遵循此许可证或具有类似规则的其他许可证。