ACertainModelオープンソースモデル - 二次元愛好者のために高詳細なアニメスタイルの画像を無料で生成

ホーム

Acertainmodel

JosephusCheungによって開発

二次元愛好者のために特別に設計された潜在拡散モデルで、簡単なプロンプトから高品質で詳細なアニメスタイルの画像を生成可能

画像生成英語オープンソースライセンス:Openrail #アニメスタイル生成 #高詳細二次元 #Danbooruタグ対応

ダウンロード数 618

リリース時間 : 12/12/2022

モデル概要

安定拡散技術をベースに最適化されたアニメスタイル画像生成モデル。danbooruタグやアーティスト名を使用した画像生成をサポートし、詳細表現において同類モデルを凌駕

モデル特徴

アニメスタイル最適化

アニメスタイルに特化して最適化され、標準的な安定拡散モデルがアニメイラスト生成で抱える制限を克服

ディテール強化

目や手などの細部表現に優れ、完成度の高い画像を生成

タグサポート

danbooruタグやアーティスト名をプロンプトとして使用可能で、期待通りの画像を生成

モデル能力

アニメスタイル画像生成

テキストプロンプトに基づく画像創作

高詳細画像レンダリング

動的なシーン表現

使用事例

アニメ創作

キャラクターデザイン

アニメキャラクターのコンセプトアートを迅速に生成

特定の髪色や瞳色など特徴を持ったアニメキャラクターを生成可能

シーン創作

アニメスタイルの背景やシーンを生成

複雑な光と影の効果や、秋の落ち葉シーンなどの季節特徴を表現可能

🚀 ACertainModel

このモデルは、わずかなプロンプトで高品質かつ詳細なアニメスタイルの画像を生成する潜在拡散モデルです。他のアニメスタイルのStable Diffusionモデルと同様に、アーティストを含むdanbooruタグをサポートして画像を生成します。

🚀 クイックスタート

Google Colabの無料T4で全機能を試す

コミュニティのアートワークはTwitterの #ACertainModel をチェックしてください。

このモデルは、わずかなプロンプトで高品質かつ詳細なアニメスタイルの画像を生成することを目的としています。他のアニメスタイルのStable Diffusionモデルと同様に、アーティストを含むdanbooruタグをサポートして画像を生成することができます。

Stable-Diffusion-v-1-4チェックポイントで導入されたlaion-aestheticsがアニメスタイルのイラスト生成モデルの微調整を妨げることに気づき、Dreamboothを使用して一部のタグを個別に微調整し、SD1.2に近づけました。過学習と潜在的な言語ドリフトを避けるために、Anything-3.0などのコミュニティで人気のあるモデルを使用して、単語プロンプトから自動生成された大量の画像をトレーニングセットに追加し、一部手動で選択された1年以内の完全なdanbooru画像とともに、さらにネイティブトレーニングを行いました。また、LoRA の方法も知っており、同様の考え方で、注意層のみを微調整することで、目や手などの細部でより良いパフォーマンスを得ることができます。

著作権遵守と技術実験のために、いくつかのアーティストの画像から直接トレーニングを行いました。コミュニティで人気のあるいくつかの拡散モデルから生成された画像を使用してDreamboothでトレーニングしました。チェックポイントはStable Diffusionモデルの重みで初期化され、その後、V100 32GBで2K GPU時間、A100 40GBで600 GPU時間、512Pの動的アスペクト比解像度で、コミュニティで人気のあるいくつかの拡散モデルから自動生成された画像と、いくつかのTextual InversionsとHypernetworksを使用して、一定の比率で教師なし自動生成画像を含めて微調整されました。xformersと8ビット最適化のトリックも知っていますが、より良い品質と安定性のために使用していません。最大15のブランチが同時にトレーニングされ、約20,000ステップごとにチェリーピックされます。

例: masterpiece, best quality, 1girl, brown hair, green eyes, colorful, autumn, cumulonimbus clouds, lighting, blue sky, falling leaves, garden

✨ 主な機能

オンラインプレビューとモデルによる生成について

パラメータの変更は許可されていません。Clip skip: 1 で生成されているようですが、より良いパフォーマンスを得るために、Clip skip: 2 の使用を強くお勧めします。

独自のサーバーで適用可能な場合の推論設定の例を以下に示します: Steps: 28, Sampler: Euler a, CFG scale: 11, Clip skip: 2。

Diffusers

このモデルは、他のStable Diffusionモデルと同じように使用できます。詳細については、Stable Diffusion を参照してください。

また、このモデルを ONNX、MPS、および/またはFLAX/JAXにエクスポートすることもできます。

💻 使用例

基本的な使用法

from diffusers import StableDiffusionPipeline
import torch

model_id = "JosephusCheung/ACertainModel"
branch_name= "main"

pipe = StableDiffusionPipeline.from_pretrained(model_id, revision=branch_name, torch_dtype=torch.float16)
pipe = pipe.to("cuda")

prompt = "pikachu"
image = pipe(prompt).images[0]

image.save("./pikachu.png")

生成画像の例

このモデルを使用して生成された画像の例を以下に示します。他の類似モデルと比較して、構図や手のジェスチャー、移動するオブジェクトに対してより良いパフォーマンスを発揮します。

アニメガール: Anime Girl

1girl, brown hair, green eyes, colorful, autumn, cumulonimbus clouds, lighting, blue sky, falling leaves, garden
Steps: 28, Sampler: Euler a, CFG scale: 11, Seed: 114514, Clip skip: 2

アニメボーイ: Anime Boy

1boy, brown hair, green eyes, colorful, autumn, cumulonimbus clouds, lighting, blue sky, falling leaves, garden
Steps: 28, Sampler: Euler a, CFG scale: 11, Seed: 114514, Clip skip: 2

📄 ライセンス

このモデルはオープンアクセスです。CreativeML OpenRAIL-Mライセンスによって、権利と使用方法がさらに規定されています。

CreativeML OpenRAILライセンスでは以下が規定されています:

モデルを使用して、意図的に違法または有害な出力やコンテンツを生成したり共有したりすることはできません。
作者は生成された出力に対して権利を主張せず、ユーザーは自由に使用することができますが、ライセンスに定められた規定に違反しないように責任を負います。
重みを再配布し、モデルを商用および/またはサービスとして使用することができます。その場合、ライセンスに記載されている同じ使用制限を含め、CreativeML OpenRAIL-Mのコピーをすべてのユーザーに共有する必要があります（ライセンス全体を注意深く読んでください）。完全なライセンスはこちらを読んでください