DashAnimeXL - V1オープンソース文生図モデル - 無料で高品質なアニメ画像を生成、手の描写がより正確

ホーム

Dashanimexl V1

dashtoonによって開発

DashAnimeXL V1はSDXLをファインチューニングしたテキストから画像生成モデルで、高品質なアニメ画像生成のために設計されており、手の解剖学的構造が強化され、プロンプトの理解能力が向上しています。

画像生成英語#アニメスタイル生成 #高品質な手のディテール #SDXLファインチューニング

ダウンロード数 61

リリース時間 : 8/1/2024

モデル概要

このモデルは拡散モデルベースのテキストから画像生成モデルで、テキストプロンプトから高品質なアニメスタイルの画像を生成することに特化しています。

モデル特徴

強化された手の解剖学的構造

アニメキャラクター生成時に手のディテールをより適切に処理できます

改善された概念理解

複雑なプロンプトの理解能力が向上しています

最適化されたプロンプト解析

テキストプロンプトの要求をより正確に解析・実現できます

高品質なアニメスタイル

アニメスタイル画像生成に特化して最適化されています

モデル能力

テキストから画像生成

アニメスタイル画像創作

高解像度画像生成

スタイライズド画像生成

使用事例

デジタルアート創作

アニメキャラクターデザイン

テキスト記述に基づいてユニークなアニメキャラクターイメージを生成

高品質でスタイルが統一されたアニメキャラクター画像

コンセプトアート創作

アニメスタイルのコンセプトアートを迅速に生成

ゲームやアニメプロジェクトのコンセプトデザインに使用可能

コンテンツ創作

イラスト生成

ストーリーや記事用のアニメスタイルイラストを生成

スタイルが統一されたシリーズイラスト作品

🚀 DashAnimeXL V1

DashAnimeXL V1は、拡散ベースのテキストから画像を生成するモデルです。このモデルは、Dashtoonの研究チームによって、SDXLをファインチューニングしたものです。詳細については、ブログをご覧ください。

🚀 クイックスタート

DashAnimeXL V1は、拡散ベースのテキストから画像を生成するモデルです。このモデルは、Dashtoonの研究チームによって開発され、SDXLをベースにファインチューニングされています。

モデルの使用方法

DashAnimeXL V1を使用するには、まず必要なライブラリをインストールします。

pip install diffusers --upgrade
pip install transformers accelerate safetensors

次に、以下の例のように画像を生成するスクリプトを実行できます。

import torch
from diffusers import (
    StableDiffusionXLPipeline, 
    EulerAncestralDiscreteScheduler,
    AutoencoderKL
)

# VAEコンポーネントをロード
vae = AutoencoderKL.from_pretrained(
    "madebyollin/sdxl-vae-fp16-fix", 
    torch_dtype=torch.bfloat16
)

# パイプラインを設定
pipe = StableDiffusionXLPipeline.from_pretrained(
    "dashtoon/DashAnimeXL-V1", 
    vae=vae,
    torch_dtype=torch.bfloat16, 
    use_safetensors=True, 
)
pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)

if torch.cuda.is_available():
  pipe.to('cuda')

# プロンプトを定義して画像を生成
prompt = "anime illustration, An ink painting with a superhot, pop art style, featuring vibrant splashes and gradient patterns merging with random signals and noise. A zoomed-in panda wearing glasses, appearing to look directly at the viewer. The piece is bathed in warm, volumetric lighting against a clear dusk sky background. The reflection in the panda's sunglasses reveals nuclear clouds, adding an element of surrealism."
negative_prompt = "nsfw, low quality, worst quality, very displeasing, 3d, watermark, signature, ugly, poorly drawn"

image = pipe(
    prompt, 
    negative_prompt=negative_prompt, 
    width=1024,
    height=1024,
    guidance_scale=7,
    num_inference_steps=20
).images[0]

✨ 主な機能

DashAnimeXL V1は、テキストプロンプトから高品質のアニメ画像を生成するように設計されています。手の解剖学的表現が向上し、概念理解とプロンプトの解釈能力が高いという特徴があります。

📦 インストール

DashAnimeXL V1を使用するには、以下のライブラリをインストールする必要があります。

pip install diffusers --upgrade
pip install transformers accelerate safetensors

💻 使用例

基本的な使用法

以下は、DashAnimeXL V1を使用して画像を生成する例です。

import torch
from diffusers import (
    StableDiffusionXLPipeline, 
    EulerAncestralDiscreteScheduler,
    AutoencoderKL
)

# VAEコンポーネントをロード
vae = AutoencoderKL.from_pretrained(
    "madebyollin/sdxl-vae-fp16-fix", 
    torch_dtype=torch.bfloat16
)

# パイプラインを設定
pipe = StableDiffusionXLPipeline.from_pretrained(
    "dashtoon/DashAnimeXL-V1", 
    vae=vae,
    torch_dtype=torch.bfloat16, 
    use_safetensors=True, 
)
pipe.scheduler = EulerAncestralDiscreteScheduler.from_config(pipe.scheduler.config)

if torch.cuda.is_available():
  pipe.to('cuda')

# プロンプトを定義して画像を生成
prompt = "anime illustration, An ink painting with a superhot, pop art style, featuring vibrant splashes and gradient patterns merging with random signals and noise. A zoomed-in panda wearing glasses, appearing to look directly at the viewer. The piece is bathed in warm, volumetric lighting against a clear dusk sky background. The reflection in the panda's sunglasses reveals nuclear clouds, adding an element of surrealism."
negative_prompt = "nsfw, low quality, worst quality, very displeasing, 3d, watermark, signature, ugly, poorly drawn"

image = pipe(
    prompt, 
    negative_prompt=negative_prompt, 
    width=1024,
    height=1024,
    guidance_scale=7,
    num_inference_steps=20
).images[0]

📚 ドキュメント

モデルの説明

属性	详情
開発者	Dashtoon
モデルタイプ	拡散ベースのテキストから画像を生成するモデル
ライセンス	CreativeML Open RAIL++-M License
モデルの説明	DashAnimeXL V1は、テキストプロンプトから高品質のアニメ画像を生成するように設計されています。手の解剖学的表現が向上し、概念理解とプロンプトの解釈能力が高いという特徴があります。
概要	このモデルは、テキストプロンプトに基づいて画像を生成します。Stable Diffusion XLと同じアーキテクチャを持っています。
ファインチューニング元のモデル	SDXL