🚀 Kivotos XL 2.0
Kivotos XL 2.0 是 Yodayo Kivotos XL 系列的最新版本,它基於 Animagine XL V3 這一專門用於生成高質量動漫風格藝術作品的 SDXL 模型構建。經過額外的微調與優化,該模型專注於生成能夠精準呈現《蔚藍檔案》系列視覺風格與美學的圖像。
🚀 快速開始
本模型支持多種使用方式:
- 在我們的平臺上使用此模型:

- 在
ComfyUI
或 Stable Diffusion Webui
中使用
- 使用 🧨
diffusers
庫進行使用
✨ 主要特性
- 基於 Animagine XL V3 構建,專為生成高質量動漫風格藝術作品而設計。
- 經過額外微調與優化,專注於生成符合《蔚藍檔案》系列視覺風格與美學的圖像。
- 繼承了 Animagine XL 3.1 的特殊標籤,可提升圖像生成效果。
📦 安裝指南
首先安裝所需的庫:
pip install diffusers transformers accelerate safetensors --upgrade
💻 使用示例
基礎用法
import torch
from diffusers import StableDiffusionXLPipeline
pipe = StableDiffusionXLPipeline.from_pretrained(
"yodayo-ai/kivotos-xl-2.0",
torch_dtype=torch.float16,
use_safetensors=True,
custom_pipeline="lpw_stable_diffusion_xl",
add_watermarker=False,
variant="fp16"
)
pipe.to('cuda')
prompt = "1girl, kazusa \(blue archive\), blue archive, solo, upper body, v, smile, looking at viewer, outdoors, night, masterpiece, best quality, very aesthetic, absurdres"
negative_prompt = "nsfw, (low quality, worst quality:1.2), very displeasing, 3d, watermark, signature, ugly, poorly drawn"
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=832,
height=1216,
guidance_scale=7,
num_inference_steps=28
).images[0]
image.save("./cat.png")
📚 詳細文檔
標籤順序
為獲得最佳效果,建議遵循以下結構化提示模板,因為模型是按照此方式進行訓練的:
1girl/1boy, 角色名稱, 所屬系列, 藝術家, 其他任意順序的內容。
特殊標籤
Kivotos XL 2.0 繼承了 Animagine XL 3.1 的特殊標籤,可通過引導結果朝向質量、評級、創作日期和美學方向來增強圖像生成效果。即使不使用這些標籤,模型也能生成圖像,但使用它們有助於獲得更好的結果。
- 質量標籤:masterpiece, best quality, great quality, good quality, normal quality, low quality, worst quality
- 評級標籤:safe, sensitive, nsfw, explicit
- 年份標籤:newest, recent, mid, early, oldest
- 美學標籤:very aesthetic, aesthetic, displeasing, very displeasing
推薦設置
為引導模型生成高美學的圖像,建議使用以下設置:
nsfw, (low quality, worst quality:1.2), very displeasing, 3d, watermark, signature, ugly, poorly drawn
masterpiece, best quality, very aesthetic, absurdres
- 無分類器引導(CFG)比例:建議在 5 到 7 之間;10 會使圖像效果過度,大於 12 則會嚴重失真。
- 採樣步數:建議在 25 到 30 之間;28 是最佳值。
- 採樣器:強烈推薦使用 Euler Ancestral (Euler a)。
- 支持的分辨率:
1024 x 1024, 1152 x 896, 896 x 1152, 1216 x 832, 832 x 1216, 1344 x 768, 768 x 1344, 1536 x 640, 640 x 1536
🔧 技術細節
以下是訓練期間使用的關鍵超參數:
屬性 |
預訓練 |
微調 |
硬件 |
2x H100 80GB PCIe |
1x A100 80GB PCIe |
批量大小 |
32 |
48 |
梯度累積步數 |
2 |
1 |
噪聲偏移 |
無 |
0.0357 |
訓練輪數 |
10 |
10 |
UNet 學習率 |
5e-6 |
3.75e-6 |
文本編碼器學習率 |
2.5e-6 |
無 |
優化器 |
Adafactor |
Adafactor |
優化器參數 |
Scale Parameter: False, Relative Step: False, Warmup Init: False (0.9, 0.99) |
Scale Parameter: False, Relative Step: False, Warmup Init: False |
調度器 |
Constant with Warmups |
Constant with Warmups |
熱身步數 |
0.05% |
0.05% |
📄 許可證
Kivotos XL 2.0 遵循 Fair AI Public License 1.0-SD 許可證,該許可證與 Stable Diffusion 模型的許可證兼容。關鍵要點如下:
- 修改共享:如果對 Kivotos XL 2.0 進行了修改,必須同時共享修改內容和原始許可證。
- 源代碼可訪問性:如果修改後的版本可通過網絡訪問,需提供一種方式(如下載鏈接)讓他人獲取源代碼。這也適用於派生模型。
- 分發條款:任何分發都必須遵循此許可證或具有類似規則的其他許可證。