holodayo-xl-2.1開源模型 - 免費生成高質量虛擬YouTuber動漫風格圖像

首頁

Holodayo Xl 2.1

由ckpt開發

基於Animagine XL V3微調的高質量虛擬YouTuber動漫風格圖像生成模型

圖像生成英語開源協議:其他 #虛擬YouTuber生成 #動漫風格優化 #高分辨率圖像

下載量 33

發布時間 : 6/5/2024

模型概述

Holodayo XL 2.1是Yodayo Holodayo XL系列的最新版本，專注於生成準確反映虛擬YouTuber系列視覺風格和美學的圖像。

模型特點

高質量動漫風格

專注於生成高質量虛擬YouTuber風格的動漫藝術作品

改進的視覺質量

修復了手部、解剖結構等問題，優化了美學表現

特殊標籤支持

支持質量、評級、年份和美學等特殊標籤以增強生成效果

模型能力

動漫風格圖像生成

虛擬YouTuber角色創作

高質量藝術作品生成

使用案例

數字藝術創作

虛擬YouTuber角色設計

為虛擬YouTuber系列創建角色形象

生成符合虛擬YouTuber美學的角色圖像

動漫風格插畫

生成各種動漫風格的插畫作品

高質量、高美學的動漫藝術作品

🚀 Holodayo XL 2.1

Holodayo XL 2.1 是 Yodayo Holodayo XL 系列的最新版本，它基於 Animagine XL V3 這一專門用於生成高質量動漫風格藝術作品的 SDXL 模型構建。該模型經過額外的微調與優化，專注於生成能夠精準呈現虛擬主播系列視覺風格和美學的圖像。

🚀 快速開始

你可以在以下平臺使用這個模型：

在我們的平臺使用此模型：
在 ComfyUI 或 Stable Diffusion Webui 中使用。
使用 🧨 diffusers 庫進行使用。

✨ 主要特性

優化改進：修復了 Holodayo XL 2.0 中存在的諸多問題，如手部繪製不佳、人體結構不準確、因微調階段訓練文本編碼器導致的災難性遺忘，以及通過減少美學數據集解決過度曝光的藝術風格問題。
繼承特殊標籤：繼承了 Animagine XL 3.1 的特殊標籤，可增強圖像生成效果，引導結果朝著質量、評級、創作日期和美學方向發展。

📦 安裝指南

首先安裝所需的庫：

pip install diffusers transformers accelerate safetensors --upgrade

💻 使用示例

基礎用法

import torch
from diffusers import StableDiffusionXLPipeline

pipe = StableDiffusionXLPipeline.from_pretrained(
    "yodayo-ai/holodayo-xl-2.1", 
    torch_dtype=torch.float16, 
    use_safetensors=True,
    custom_pipeline="lpw_stable_diffusion_xl",
    add_watermarker=False,
    variant="fp16"
)
pipe.to('cuda')

prompt = "1girl, nakiri ayame, nakiri ayame \(1st costume\), hololive, solo, upper body, v, smile, looking at viewer, outdoors, night, masterpiece, best quality, very aesthetic, absurdres"
negative_prompt = "nsfw, (low quality, worst quality:1.2), very displeasing, 3d, watermark, signature, ugly, poorly drawn"

image = pipe(
    prompt, 
    negative_prompt=negative_prompt,
    width=832,
    height=1216, 
    guidance_scale=7,
    num_inference_steps=28
).images[0]

image.save("./waifu.png")

📚 詳細文檔

標籤排序

為獲得最佳效果，建議遵循以下結構化提示模板，因為我們是按照此方式訓練模型的：

1girl/1boy, 角色名稱, 所屬系列, 藝術家, 其他信息（順序不限）。

特殊標籤

Holodayo XL 2.1 繼承了 Animagine XL 3.1 的特殊標籤，以增強圖像生成效果，引導結果朝著質量、評級、創作日期和美學方向發展。即使不使用這些標籤，模型也能生成圖像，但使用它們有助於獲得更好的結果。

質量標籤：masterpiece（傑作）, best quality（最佳質量）, great quality（高質量）, good quality（良好質量）, normal quality（普通質量）, low quality（低質量）, worst quality（最差質量）
評級標籤：safe（安全）, sensitive（敏感）, nsfw（不適合工作場合）, explicit（露骨）
年份標籤：newest（最新）, recent（近期）, mid（中期）, early（早期）, oldest（最舊）
美學標籤：very aesthetic（非常美觀）, aesthetic（美觀）, displeasing（令人不悅）, very displeasing（非常令人不悅）

🔧 技術細節

以下是訓練期間使用的關鍵超參數：

屬性	詳情
開發人員	Linaqruf
模型類型	基於擴散的文本到圖像生成模型
模型描述	Holodayo XL 2.1 是 Yodayo Holodayo XL 系列的最新版本，是一個基於 Animagine XL V3 的開源模型，經過微調以生成高質量的虛擬主播動漫風格藝術作品。
許可證	Fair AI Public License 1.0 - SD
微調基礎模型	Animagine XL 3.1

特性	預訓練	微調
硬件	2x H100 80GB PCIe	2x A100 80GB PCIe
批量大小	64	48
梯度累積步數	2	1
噪聲偏移	無	0.0357
訓練輪數	10	10
UNet 學習率	7.5e - 6	7.5e - 6
文本編碼器學習率	3.75e - 6	無
優化器	AdamW8bit	Adafactor
優化器參數	權重衰減：0.1，貝塔值：(0.9, 0.99)	縮放參數：False，相對步長：False，預熱初始化：False
調度器	帶預熱的常數調度器	帶預熱的常數調度器
預熱步數	0.5%	0.5%