trinart_characters_19.2m_stable_diffusion_v1オープンソースモデル - 多様なアニメ漫画風の高品質画像を生成

ホーム

Trinart Characters 19.2m Stable Diffusion V1

naclbitによって開発

Stable Diffusion v1をベースにしたアニメ/漫画スタイルの画像生成モデルで、約1920万枚の画像でトレーニングされ、芸術スタイルの多様性と解剖学的品質のバランスを追求しています。

画像生成オープンソースライセンス:Openrail #アニメキャラクター生成 #芸術スタイルの多様性 #解剖学の最適化

ダウンロード数 11.88k

リリース時間 : 10/15/2022

モデル概要

このモデルは高品質なアニメ/漫画スタイルの画像生成に特化しており、大規模なデータトレーニングと微調整を経て、キャラクターデザインやアート創作に適しています。

モデル特徴

大規模トレーニングデータ

トレーニングデータには約1920万枚のアニメ/漫画スタイル画像が含まれ、5万枚の画像で微調整されています

芸術スタイルの多様性

Stable Diffusion v1の仕様範囲内で、芸術スタイルの多様性と解剖学的品質の最適なバランスを追求しています

セキュリティ強化

データセットはNSFWコンテンツを除外するようにフィルタリングされており、オリジナルのSDv1.4と比べて不適切なコンテンツが生成されにくくなっています

カスタムオートエンコーダ

独立したカスタムKLオートエンコーダチェックポイントを提供し、生成結果を改善できます

モデル能力

アニメスタイル画像生成

キャラクターデザイン

アート創作

高品質画像レンダリング

使用事例

デジタルアート創作

アニメキャラクターデザイン

様々なスタイルのアニメキャラクター画像を生成

異なる芸術スタイルと解剖学的に安定したキャラクターイメージを生成可能

シーン構築

アニメスタイルのシーンや背景を作成

例にある酒場や大聖堂などのシーン

コンセプトデザイン

キャラクターコンセプト開発

迅速にキャラクターコンセプトスケッチを生成

異なる服装、髪型、ポーズのキャラクターを生成可能

🚀 Stable Diffusion TrinArt Characters model v1

このモデルは、約1920万枚のアニメ/マンガスタイルの画像（事前ロールアウトされた拡張画像を含む）で学習され、さらに約5万枚の画像でファインチューニングされたStable Diffusion v1ベースのモデルです。このモデルは、SDv1のモデル仕様内で、芸術的なスタイルの多様性と解剖学的な品質のバランスを追求しています。

🚀 クイックスタート

このモデルの新しいバージョンがリリースされています： https://huggingface.co/naclbit/trinart_derrida_characters_v2_stable_diffusion

このモデルは、AI Novelist/TrinArtサービスで9月初旬から10月14日までリリースされたバージョン1と同じものです。現在、TrinArtサービスで新しいDerridaモデルを実験しており、さらなる改善と解剖学的な安定化を図っています。その間、この実際のサービスでテストされたCharacters v1を楽しんでください！

✨ 主な機能

ハードウェア

8xNVIDIA A100 40GB

カスタムオートエンコーダ

注: 2022年11月5日以前に誤ったチェックポイントがアップロードされていました。ファイルは最新のチェックポイントに置き換えられています。

カスタムKLオートエンコーダ用の別のチェックポイントも提供しています。Latent Diffusion論文で示唆されているように、オートエンコーダと潜在拡散モデルを別々に学習することで結果が向上することがわかりました。公式のStable Diffusionスクリプトは他のVAEの読み込みをサポートしていないため、あなたのスクリプトで実行するには、first_stage_modelのstate_dictをオーバーライドする必要があります。

人気のあるWebUIには、別のfirst_stage_modelパラメータを読み込むスクリプトがあります。

安全性

データセットは、NSFWまたは不安全なコンテンツを除外するようにフィルタリングされています。1000万枚以上のユーザー生成画像での広範な実験とテストの結果、このモデルは十分に安全であり、標準のSD v1.4モデルや他のアニメ/マンガモデルよりも問題のある（露出/過度に性的/リアルなゴア）コンテンツを生成する可能性が低いと判断しました。ただし、ユーザーがこのモデルを十分にいじった場合、やはり不快な素材を生成する可能性があります。このモデルを100％リスクフリーとは考えていません。

*この声明は、第三者がNSFWを含むこのモデルの派生モデルを学習することを必ずしも制限するものではありません。

生成例

以下の画像は、TrinArtサービスの独自のアップスケーラー、パーサー、プロセスで直接生成されたものです。結果は環境により異なります。

examples （雑多なランダムな例）

examples ワイドショット、高品質、htgngg 動物のアームレスト茶色の髪メリーな椅子カップドレス花上からの視点肩にジャケット長い髪一人で座っている砂糖壺ファンタジーな冒険者の宿のテーブルティーカップティーポット風景ミニチュア (2022アートスタイルプリセット) examples 高解像度ワイドショット前髪露出した肩水鳥の檻テラリウム切り離された袖ひだ付きひだ付きのレグウェアひだ髪の装飾髪のリボンフード長い髪中サイズの胸リボンタイハイソックス (2019アートスタイルプリセット) examples 1人の女の子が立って剣を持っている腕を上げている前髪露出した肩ブーツボウ胸明るい瞳チョーカー切り離された袖ダイヤモンド（形状）浮かんでいる浮かんでいる髪靴ボウ横からの視点全身手袋足を上げている長い髪視聴者を見ている口を開けている腕を伸ばしている一人縞模様の髪流れる前髪二色の髪非常に長い髪::4 怒っている::1 (2022アートスタイルプリセット) examples 1人の男の子が立っている剣を持って腕を上げているボウ明るい瞳ケープコートダイヤモンド（形状）浮かんでいる浮かんでいる髪折り返しブーツ靴ボウ横からの視点全身手袋足を上げている長い袖視聴者を見ている口を開けている腕を伸ばしているコートを開けている服を開けている一人流れる二色の髪タイハイブーツ::4 怒っている::1.25 (2022アートスタイルプリセット)

examples 大聖堂 1人の女子学生モモコ学校の制服猫粒子美しい流れ星詳細な大聖堂ジャケット口を開けている眼鏡猫 (2022アートスタイルプリセット)

examples 高解像度 2人の女の子百合ワイドショット前髪露出した肩水鳥の檻テラリウム切り離された袖ひだ付きひだ付きのレグウェアひだ髪の装飾髪のリボンフード長い髪中サイズの胸リボンタイハイソックス (More Detailsプリセット) examples ワイドショット、最高品質ラピス erebcir 高解像度 1人の男の子前髪黒い手袋茶色の髪口を閉じている手袋目の間の髪視聴者を見ている男性中心花緑色の目 (More Detailsプリセット)

TrinArt 2022アートスタイルプリセットのネガティブプロンプト: レトロスタイル、1980年代、1990年代、2000年代、2005、2006、2007、2008、2009、2010、2011、2012、2013、2014、2015、2016、2017、2018、2019

TrinArt More Detailsプリセットのネガティブプロンプト: フラットカラー、フラットシェーディング

解剖学的な安定化のために、既知のネガティブプロンプトのセットを追加することをお勧めします。例えば、悪い手、指の数が少ないなどです。

クレジット

Sta, AI Novelist Dev (https://ai-novel.com/) @ Bit192, Inc. Twitter https://twitter.com/naclbbr (日本語) https://twitter.com/naclbbre (英語)
Stable Diffusion - Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bjorn