🚀 NoobAI XL V-Pred 1.0
この画像生成モデルは、Laxhar/noobai-XL_v1.0をベースに構築されており、Danbooruとe621のデータセットを活用し、ネイティブタグと自然言語のキャプションを用いています。v-predictionモデルとして実装されており、特定のパラメータ設定が必要です。
🚀 クイックスタート
このモデルリポジトリは、固定されたスケジューラー設定でアップロードされているため、特別な引数なしで推論をシームレスに実行できます。
✨ 主な機能
- ネイティブタグと自然言語のキャプションを用いた画像生成
- v-predictionモデルとしての実装
📦 インストール
- (reForgeをインストールしていない場合) リポジトリの指示に従ってreForgeをインストールします。
- WebUIを起動し、通常通りモデルを使用します。
SAMLPLE with NODES
comfy_ui_workflow_sample
Method III: WebUI
devブランチは安定していない場合があり、バグが含まれる可能性があります。
- (WebUIをインストールしていない場合) リポジトリの指示に従ってWebUIをインストールします。
dev
ブランチに切り替えます。
git switch dev
- 最新の更新を取得します。
git pull
- WebUIを起動し、通常通りモデルを使用します。
import torch
from diffusers import StableDiffusionXLPipeline
from diffusers import EulerDiscreteScheduler
ckpt_path = "/path/to/model.safetensors"
pipe = StableDiffusionXLPipeline.from_single_file(
ckpt_path,
use_safetensors=True,
torch_dtype=torch.float16,
)
scheduler_args = {"prediction_type": "v_prediction", "rescale_betas_zero_snr": True}
pipe.scheduler = EulerDiscreteScheduler.from_config(pipe.scheduler.config, **scheduler_args)
pipe.enable_xformers_memory_efficient_attention()
pipe = pipe.to("cuda")
prompt = """masterpiece, best quality,artist:john_kafka,artist:nixeu,artist:quasarcake, chromatic aberration, film grain, horror \(theme\), limited palette, x-shaped pupils, high contrast, color contrast, cold colors, arlecchino \(genshin impact\), black theme, gritty, graphite \(medium\)"""
negative_prompt = "nsfw, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro"
image = pipe(
prompt=prompt,
negative_prompt=negative_prompt,
width=832,
height=1216,
num_inference_steps=28,
guidance_scale=5,
generator=torch.Generator().manual_seed(42),
).images[0]
image.save("output.png")
注意: 必ずGitをインストールし、マシンの環境を適切に構成してください。
💻 使用例
基本的な使用法
上記のMethod IV
のコードが基本的な使用例となります。
高度な使用法
高度な使用法に関する具体的なコードは元のREADMEに記載がないため、省略します。
📚 ドキュメント
推奨設定
パラメータ
- CFG: 4 ~ 5
- Steps: 28 ~ 35
- サンプリング方法: Euler (⚠️ 他のサンプラーは正常に動作しません)
- 解像度: 総面積が約1024x1024。以下から選ぶのが最適: 768x1344, 832x1216, 896x1152, 1024x1024, 1152x896, 1216x832, 1344x768
プロンプト
masterpiece, best quality, newest, absurdres, highres, safe,
nsfw, worst quality, old, early, low quality, lowres, signature, username, logo, bad hands, mutated hands, mammal, anthro, furry, ambiguous form, feral, semi-anthro
使用ガイドライン
キャプション
<1girl/1boy/1other/...>, <character>, <series>, <artists>, <special tags>, <general tags>, <other tags>
品質タグ
品質タグについては、以下のプロセスを通じて画像の人気を評価しています。
- 様々なソースと評価に基づくデータ正規化。
- 日付の新しさに応じた時間ベースの減衰係数の適用。
- この処理に基づくデータセット全体での画像のランキング。
最終的な目標は、品質タグが近年のユーザーの好みを効果的に追跡することです。
パーセンタイル範囲 |
品質タグ |
> 95th |
masterpiece |
> 85th, <= 95th |
best quality |
> 60th, <= 85th |
good quality |
> 30th, <= 60th |
normal quality |
<= 30th |
worst quality |
審美タグ
日付タグ
日付タグには、年タグと期間タグの2種類があります。年タグはyear xxxx
形式、つまりyear 2021
を使用します。期間タグについては、以下の表を参照してください。
年範囲 |
期間タグ |
2005-2010 |
old |
2011-2014 |
early |
2014-2017 |
mid |
2018-2020 |
recent |
2021-2024 |
newest |
データセット
コミュニケーション
v-pred SDXLモデルでのLoRAの学習方法
sd-scriptsに基づくLoRAトレーナー向けのチュートリアルです。
記事リンク: https://civitai.com/articles/8723
ユーティリティツール
Laxhar LabはNoobXL用の専用ControlNetモデルを学習中であり、モデルは徐々にリリースされています。これまでに、通常、深度、キャニーのモデルがリリースされています。
モデルリンク: https://civitai.com/models/929685
🔧 技術詳細
この画像生成モデルは、Laxhar/noobai-XL_v1.0をベースに構築されており、完全なDanbooruとe621データセットを活用し、ネイティブタグと自然言語のキャプションを用いています。v-predictionモデルとして実装されており、特定のパラメータ設定が必要です。
📄 ライセンス
このモデルのライセンスは、https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0 fair-ai-public-license-1.0-sdを継承し、以下の条件を追加しています。このモデルとそのバリアントの使用は、このライセンスに拘束されます。
I. 使用制限
- 有害、悪意的、または違法な活動、例えば嫌がらせ、脅迫、誤情報の拡散などに使用することを禁止します。
- 非倫理的または不快なコンテンツの生成を禁止します。
- ユーザーの管轄区域の法令に違反することを禁止します。
II. 商用禁止
モデル、派生モデル、またはモデル生成の製品の収益化や商用利用など、あらゆる形態の商業化を禁止します。
III. オープンソースコミュニティ
皆さん、面白いものを自分だけに独占せずに共有しましょう!🚀
新しいトリック、面白いアートの組み合わせ、魔法のようなプロンプト、または面白いLoRAを学習した場合は、公開して共有しましょう!
DC/TG/X/グループチャットで投稿して、一緒に成長しましょう。
昔のような秘密のモデルやプロンプトはもう必要ありません。
オープンな共有が皆のために楽しさを増やします!💡✨
PS: 私たちは何かを制限しようとしているわけではありません!以前の1.5/n3の時代には、たくさんの秘密のモデルやプロンプトが登場しました(うーん、混乱した雰囲気です)。
そのサイクルを打破しましょう!共有することで、進歩が速くなり、大胆なアイデアが生まれ、もっと盛り上がります。
ゲートキーピングはやめて、あなたの「秘密のレシピ」を公開スペースに投稿しましょう。皆が勝者です!
活発なオープンソースコミュニティを育むために、ユーザーは以下の要件を遵守する必要があります。
- 派生モデル、マージモデル、LoRA、および上記のモデルに基づく製品をオープンソースにします。
- 合成式、プロンプト、ワークフローなどの作業詳細を共有します。
- 派生作品がオープンソースのままであることを保証するために、fair-ai-public-licenseに従います。
IV. 免責事項
生成されたモデルは予期せぬまたは有害な出力を生成する可能性があります。ユーザーは使用に伴うすべてのリスクと潜在的な結果を負う必要があります。
参加者と貢献者
参加者
貢献者
- Narugo1992: narugo1992とdeepghsチームが様々な学習セット、画像処理ツール、およびモデルをオープンソースにしてくれたことに感謝します。
- Mikubill: MikubillがNaifuトレーナーを提供してくれたことに感謝します。
- Onommai: OnommAIが強力なベースモデルをオープンソースにしてくれたことに感謝します。
- V-Prediction: 以下の方々が詳細な指示と実験を行ってくれたことに感謝します。
- コミュニティ: aria1th261, neggles, sdtana, chewing, irldoggo, reoe, kblueleaf, Yidhar, ageless, 白玲可, Creeper, KaerMorh, 吟游诗人, SeASnAkE, zwh20081, Wenaka~喵, 稀里哗啦, 幸运二副, 昨日の約, 445, EBIX, Sopp, Y_X, Minthybasis, Rakosz
モデル詳細
⚠️ 重要な注意 ⚠️
このモデルはEPSモデルとは異なる動作をします!
ガイドを注意深く読んでください!