🚀 DashAnimeXL V1
DashAnimeXL V1は、拡散ベースのテキストから画像を生成するモデルです。このモデルは、Dashtoonの研究チームによって、SDXLをファインチューニングしたものです。詳細については、ブログをご覧ください。
🚀 クイックスタート
DashAnimeXL V1は、拡散ベースのテキストから画像を生成するモデルです。このモデルは、Dashtoonの研究チームによって開発され、SDXLをベースにファインチューニングされています。
モデルの使用方法
DashAnimeXL V1を使用するには、まず必要なライブラリをインストールします。
pip install diffusers --upgrade
pip install transformers accelerate safetensors
次に、以下の例のように画像を生成するスクリプトを実行できます。
import torch
from diffusers import (
StableDiffusionXLPipeline,
EulerAncestralDiscreteScheduler,
AutoencoderKL
)
vae = AutoencoderKL.from_pretrained(
"madebyollin/sdxl-vae-fp16-fix",
torch_dtype=torch.bfloat16
)
pipe = StableDiffusionXLPipeline.from_pretrained(
"dashtoon/DashAnimeXL-V1",
vae=vae,
torch_dtype=torch.bfloat16,
use_safetensors=True,
)
pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)
if torch.cuda.is_available():
pipe.to('cuda')
prompt = "anime illustration, An ink painting with a superhot, pop art style, featuring vibrant splashes and gradient patterns merging with random signals and noise. A zoomed-in panda wearing glasses, appearing to look directly at the viewer. The piece is bathed in warm, volumetric lighting against a clear dusk sky background. The reflection in the panda's sunglasses reveals nuclear clouds, adding an element of surrealism."
negative_prompt = "nsfw, low quality, worst quality, very displeasing, 3d, watermark, signature, ugly, poorly drawn"
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=1024,
height=1024,
guidance_scale=7,
num_inference_steps=20
).images[0]
✨ 主な機能
DashAnimeXL V1は、テキストプロンプトから高品質のアニメ画像を生成するように設計されています。手の解剖学的表現が向上し、概念理解とプロンプトの解釈能力が高いという特徴があります。
📦 インストール
DashAnimeXL V1を使用するには、以下のライブラリをインストールする必要があります。
pip install diffusers --upgrade
pip install transformers accelerate safetensors
💻 使用例
基本的な使用法
以下は、DashAnimeXL V1を使用して画像を生成する例です。
import torch
from diffusers import (
StableDiffusionXLPipeline,
EulerAncestralDiscreteScheduler,
AutoencoderKL
)
vae = AutoencoderKL.from_pretrained(
"madebyollin/sdxl-vae-fp16-fix",
torch_dtype=torch.bfloat16
)
pipe = StableDiffusionXLPipeline.from_pretrained(
"dashtoon/DashAnimeXL-V1",
vae=vae,
torch_dtype=torch.bfloat16,
use_safetensors=True,
)
pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)
if torch.cuda.is_available():
pipe.to('cuda')
prompt = "anime illustration, An ink painting with a superhot, pop art style, featuring vibrant splashes and gradient patterns merging with random signals and noise. A zoomed-in panda wearing glasses, appearing to look directly at the viewer. The piece is bathed in warm, volumetric lighting against a clear dusk sky background. The reflection in the panda's sunglasses reveals nuclear clouds, adding an element of surrealism."
negative_prompt = "nsfw, low quality, worst quality, very displeasing, 3d, watermark, signature, ugly, poorly drawn"
image = pipe(
prompt,
negative_prompt=negative_prompt,
width=1024,
height=1024,
guidance_scale=7,
num_inference_steps=20
).images[0]
📚 ドキュメント
モデルの説明
📄 ライセンス
このモデルは、CreativeML Open RAIL++-M Licenseの下で提供されています。