🚀 Stable Diffusion TrinArt Characters model v1
このモデルは、約1920万枚のアニメ/マンガスタイルの画像(事前ロールアウトされた拡張画像を含む)で学習され、さらに約5万枚の画像でファインチューニングされたStable Diffusion v1ベースのモデルです。このモデルは、SDv1のモデル仕様内で、芸術的なスタイルの多様性と解剖学的な品質のバランスを追求しています。
🚀 クイックスタート
このモデルの新しいバージョンがリリースされています:
https://huggingface.co/naclbit/trinart_derrida_characters_v2_stable_diffusion
このモデルは、AI Novelist/TrinArtサービスで9月初旬から10月14日までリリースされたバージョン1と同じものです。現在、TrinArtサービスで新しいDerridaモデルを実験しており、さらなる改善と解剖学的な安定化を図っています。その間、この実際のサービスでテストされたCharacters v1を楽しんでください!
✨ 主な機能
ハードウェア
カスタムオートエンコーダ
注: 2022年11月5日以前に誤ったチェックポイントがアップロードされていました。ファイルは最新のチェックポイントに置き換えられています。
カスタムKLオートエンコーダ用の別のチェックポイントも提供しています。Latent Diffusion論文で示唆されているように、オートエンコーダと潜在拡散モデルを別々に学習することで結果が向上することがわかりました。公式のStable Diffusionスクリプトは他のVAEの読み込みをサポートしていないため、あなたのスクリプトで実行するには、first_stage_modelのstate_dictをオーバーライドする必要があります。
人気のあるWebUIには、別のfirst_stage_modelパラメータを読み込むスクリプトがあります。
安全性
データセットは、NSFWまたは不安全なコンテンツを除外するようにフィルタリングされています。1000万枚以上のユーザー生成画像での広範な実験とテストの結果、このモデルは十分に安全であり、標準のSD v1.4モデルや他のアニメ/マンガモデルよりも問題のある(露出/過度に性的/リアルなゴア)コンテンツを生成する可能性が低いと判断しました。ただし、ユーザーがこのモデルを十分にいじった場合、やはり不快な素材を生成する可能性があります。このモデルを100%リスクフリーとは考えていません。
*この声明は、第三者がNSFWを含むこのモデルの派生モデルを学習することを必ずしも制限するものではありません。
生成例
以下の画像は、TrinArtサービスの独自のアップスケーラー、パーサー、プロセスで直接生成されたものです。結果は環境により異なります。
(雑多なランダムな例)
ワイドショット、高品質、htgngg 動物のアームレスト 茶色の髪 メリーな椅子 カップ ドレス 花 上からの視点 肩にジャケット 長い髪 一人で座っている 砂糖壺 ファンタジーな冒険者の宿のテーブル ティーカップ ティーポット 風景 ミニチュア (2022アートスタイルプリセット)
高解像度 ワイドショット 前髪 露出した肩 水鳥の檻 テラリウム 切り離された袖 ひだ付き ひだ付きのレグウェア ひだ 髪の装飾 髪のリボン フード 長い髪 中サイズの胸 リボン タイハイソックス (2019アートスタイルプリセット)
1人の女の子が立って剣を持っている 腕を上げている 前髪 露出した肩 ブーツ ボウ 胸 明るい瞳 チョーカー 切り離された袖 ダイヤモンド(形状) 浮かんでいる 浮かんでいる髪 靴 ボウ 横からの視点 全身 手袋 足を上げている 長い髪 視聴者を見ている 口を開けている 腕を伸ばしている 一人 縞模様の髪 流れる前髪 二色の髪 非常に長い髪::4 怒っている::1 (2022アートスタイルプリセット)
1人の男の子が立っている 剣を持って腕を上げている ボウ 明るい瞳 ケープ コート ダイヤモンド(形状) 浮かんでいる 浮かんでいる髪 折り返しブーツ 靴 ボウ 横からの視点 全身 手袋 足を上げている 長い袖 視聴者を見ている 口を開けている 腕を伸ばしている コートを開けている 服を開けている 一人 流れる 二色の髪 タイハイブーツ::4 怒っている::1.25 (2022アートスタイルプリセット)
大聖堂 1人の女子学生 モモコ 学校の制服 猫 粒子 美しい流れ星 詳細な大聖堂 ジャケット 口を開けている 眼鏡 猫 (2022アートスタイルプリセット)
高解像度 2人の女の子 百合 ワイドショット 前髪 露出した肩 水鳥の檻 テラリウム 切り離された袖 ひだ付き ひだ付きのレグウェア ひだ 髪の装飾 髪のリボン フード 長い髪 中サイズの胸 リボン タイハイソックス (More Detailsプリセット)
ワイドショット、最高品質 ラピス erebcir 高解像度 1人の男の子 前髪 黒い手袋 茶色の髪 口を閉じている 手袋 目の間の髪 視聴者を見ている 男性中心 花 緑色の目 (More Detailsプリセット)
TrinArt 2022アートスタイルプリセットのネガティブプロンプト: レトロスタイル、1980年代、1990年代、2000年代、2005、2006、2007、2008、2009、2010、2011、2012、2013、2014、2015、2016、2017、2018、2019
TrinArt More Detailsプリセットのネガティブプロンプト: フラットカラー、フラットシェーディング
解剖学的な安定化のために、既知のネガティブプロンプトのセットを追加することをお勧めします。例えば、悪い手、指の数が少ないなどです。
クレジット
-
Sta, AI Novelist Dev (https://ai-novel.com/) @ Bit192, Inc. Twitter https://twitter.com/naclbbr (日本語) https://twitter.com/naclbbre (英語)
-
Stable Diffusion - Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bjorn
📄 ライセンス
CreativeML OpenRAIL-M