🚀 AnimeBoysXL v3.0
AnimeBoysXL v3.0は、幅広いスタイルのアニメキャラクターの男性画像を生成することができる柔軟なモデルです。また、中性的なスタイルと多くの概念を認識する能力から、さらなるトレーニングにも適しています。
🚀 クイックスタート
モデルのベークには多大な時間と労力が必要です。もし私のモデルを気に入っていただけたら、Ko-fi での支援をいただけると幸いです ☕。
✨ 主な機能
- ✔️ 推論に適している:AnimeBoysXL v3.0は、幅広いスタイルでアニメの少年や男性専用のコンテンツの画像生成に優れた柔軟なモデルです。
- ✔️ トレーニングに適している:AnimeBoysXL v3.0は、中性的なスタイルと多くの概念を認識する能力のおかげで、さらなるトレーニングに適しています。AnimeBoysXLから独自のアニメ少年モデル/LoRAを自由にトレーニングしてください。
📚 ドキュメント
推論ガイド
- プロンプト:タグベースのプロンプトを使用して、対象を説明します。
- タグの順序は重要です。以下のテンプレートでプロンプトを構成することを強くお勧めします。
1boy, male focus, character name, series name, anything else you'd like to describe, best quality, amazing quality, best aesthetic, absurdres
2boys, male focus, multiple boys, character name(s), series name, anything else you'd like to describe, best quality, amazing quality, best aesthetic, absurdres
- より詳細なドキュメントについては、Ko-fiの記事(サポーター限定)を参照してください。
- ネガティブプロンプト:以下の2つのプリセットから選択してください。
- 強い(推奨):
lowres, bad, text, error, missing, extra, fewer, cropped, jpeg artifacts, worst quality, bad quality, watermark, bad aesthetic, unfinished, chromatic aberration, scan, scan artifacts
- 弱い:
lowres, jpeg artifacts, worst quality, watermark, blurry, bad aesthetic
- VAE:SDXL VAE を使用していることを確認してください。
- サンプリング方法、サンプリングステップ、CFGスケール:私は (Euler a, 28, 8.5) が良いと思います。他の設定を試してみることをお勧めします。
- 幅と高さ:縦長の場合は 832*1216、正方形の場合は 1024*1024、横長の場合は 1216*832 を使用します。
💻 使用例
基本的な使用法
import torch
from diffusers import DiffusionPipeline
pipe = DiffusionPipeline.from_pretrained("Koolchh/AnimeBoysXL-v3.0", torch_dtype=torch.float16, use_safetensors=True, variant="fp16")
pipe.to("cuda")
prompt = "1boy, male focus, shirt, solo, looking at viewer, smile, black hair, brown eyes, short hair, best quality, amazing quality, best aesthetic, absurdres"
negative_prompt = "lowres, bad, text, error, missing, extra, fewer, cropped, jpeg artifacts, worst quality, bad quality, watermark, bad aesthetic, unfinished, chromatic aberration, scan, scan artifacts"
image = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
width=1024,
height=1024,
guidance_scale=8.5,
num_inference_steps=28
).images[0]
🔧 技術詳細
トレーニングの詳細
AnimeBoysXL v3.0は、Pony Diffusion V6 XL から約516kの画像でトレーニングされています。
トレーニングデータには、より美的な結果またはより柔軟な結果に向けて誘導しやすくするために、以下のタグが付けられています。
品質タグ
タグ |
スコア |
best quality |
>= 150 |
amazing quality |
[75, 150) |
great quality |
[25, 75) |
normal quality |
[0, 25) |
bad quality |
(-5, 0) |
worst quality |
<= -5 |
美学タグ
AnimeBoysXL v3.0の美学タグは、開発者の美学的な好みを反映しています。
タグ |
best aesthetic |
amazing aesthetic |
great aesthetic |
normal aesthetic |
bad aesthetic |
レーティングタグ
タグ |
レーティング |
sfw |
general |
slightly nsfw |
sensitive |
fairly nsfw |
questionable |
very nsfw |
explicit |
年タグ
year YYYY
ここで、YYYY
は [2005, 2023] の範囲です。
トレーニング設定
- ハードウェア:4 * Nvidia A100 80GB GPU
- オプティマイザー:AdaFactor
- 勾配累積ステップ:8
- バッチサイズ:4 * 8 * 4 = 128
- 学習率:
- U-Netには 8e-6
- テキストエンコーダ1 (CLIP ViT-L) には 5.2e-6
- テキストエンコーダ2 (OpenCLIP ViT-bigG) には 4.8e-6
- 学習率スケジュール:250ウォームアップステップを伴う定数
- 混合精度トレーニングタイプ:FP16
- エポック数:40
v2.0からの変更点
- ベースモデルをStable Diffusion XL Base 1.0からPony Diffusion V6 XLに変更しました。
- 開発者の好みに基づいて、データセットの美学タグを一新しました。
- 品質タグの基準を更新しました。
- FP16混合精度トレーニングを使用しました。
- より多くのエポック数でトレーニングしました。
特別な感謝
展示用の画像の支援をしてくれた chefFromSpace に感謝します。
📄 ライセンス
AnimeBoysXL v3.0は、PurpleSmartAIによるPony Diffusion V6 XL の派生モデルであるため、以前のバージョンとは異なるライセンスが適用されます。モデルを使用する前に、そのライセンスをお読みください。