🚀 Stable Diffusion TrinArt Characters model v1
Stable Diffusion TrinArt Characters model v1 是基於 Stable Diffusion v1 的模型,使用約 1920 萬張動漫風格圖像(包括預卷增強圖像)進行訓練,並最終使用約 5 萬張圖像進行微調。該模型旨在在 SDv1 給定的模型規格內,尋求藝術風格多樣性和解剖學質量之間的平衡點。
🚀 快速開始
此模型已發佈新版本:
https://huggingface.co/naclbit/trinart_derrida_characters_v2_stable_diffusion
✨ 主要特性
訓練數據
trinart_characters_19.2m_stable_diffusion_v1 基於約 1920 萬張動漫風格圖像(包括預卷增強圖像)進行訓練,並最終使用約 5 萬張圖像進行微調。
硬件要求
自定義自編碼器
注意:2022 年 11 月 5 日之前上傳的檢查點有誤,該文件已替換為最新檢查點。
我們還為自定義 KL 自編碼器提供了單獨的檢查點。正如潛擴散論文所建議的,我們發現分別訓練自編碼器和潛擴散模型可以改善結果。由於官方的穩定擴散腳本不支持加載其他 VAE,為了在你的腳本中運行它,你需要覆蓋 first_stage_model 的 state_dict。
流行的 WebUI 有加載單獨的 first_stage_model 參數的腳本。
安全性
數據集經過過濾,排除了 NSFW 或不安全內容。經過我們對 1000 多萬張用戶生成圖像的廣泛實驗和測試,我們認為該模型足夠安全,與原始的 SD v1.4 模型或其他動漫模型相比,不太可能生成有問題(裸露、過度色情、逼真血腥)的內容。然而,如果用戶對該模型進行足夠的“折磨”,仍有可能迫使該模型生成令人反感的材料。我們不認為該模型 100% 無風險。
*本聲明並不一定限制第三方訓練包含 NSFW 內容的此模型的衍生版本。
💻 使用示例
基礎用法
以下圖像是由原生 TrinArt 服務直接生成的,使用了其特有的上採樣器、解析器和處理流程。實際效果可能會有所不同。
(各種隨機示例)
全景、高質量、htgngg 動物扶手、棕色頭髮、歡樂的椅子、杯子、連衣裙、花朵、從上往下看、肩上搭著夾克、長髮、獨自坐著、糖碗、奇幻冒險家旅館桌子、茶杯、茶壺、風景、微縮景觀(2022 藝術風格預設)
高分辨率全景、齊劉海、裸露肩膀、水鳥籠、玻璃容器、分離式袖子、褶邊、褶邊腿部服飾、褶邊裝飾、髮飾、髮帶、兜帽、長髮、中等胸部、絲帶、過膝襪(2019 藝術風格預設)
1 個女孩站立、手持劍、手臂舉起、齊劉海、裸露肩膀、靴子、蝴蝶結、胸部、明亮的瞳孔、項圈、分離式袖子、菱形(形狀)、漂浮、漂浮的頭髮、鞋上的蝴蝶結、從側面看、全身、手套、腿抬起、長髮、看著觀眾、張嘴、伸展的手臂、獨自、有條紋的頭髮、齊劉海向後梳、雙色頭髮、非常長的頭髮::4 憤怒::1(2022 藝術風格預設)
1 個男孩、男性焦點、站立、手持劍、手臂舉起、蝴蝶結、明亮的瞳孔、披風、外套、菱形(形狀)、漂浮、漂浮的頭髮、翻邊靴子、鞋上的蝴蝶結、從側面看、全身、手套、腿抬起、長袖、看著觀眾、張嘴、伸展的手臂、敞開的外套、敞開的衣服、獨自、齊劉海向後梳、雙色頭髮、大腿靴::4 憤怒::1.25(2022 藝術風格預設)
大教堂、1 個女學生、桃子頭造型、校服、貓、粒子、美麗的流星、詳細的大教堂、張嘴、眼鏡、貓(2022 藝術風格預設)
高分辨率、2 個女孩、百合、全景、齊劉海、裸露肩膀、水鳥籠、玻璃容器、分離式袖子、褶邊、褶邊腿部服飾、褶邊裝飾、髮飾、髮帶、兜帽、長髮、中等胸部、絲帶、過膝襪(更多細節預設)
全景、最佳質量、青金石、高分辨率、1 個男孩、齊劉海、黑色手套、棕色頭髮、閉嘴、眼睛間的頭髮、看著觀眾、男性焦點、花朵、綠色眼睛(更多細節預設)
TrinArt 2022 藝術風格預設負面提示詞:復古風格、20 世紀 80 年代、20 世紀 90 年代、2000 年代、2005 年、2006 年、2007 年、2008 年、2009 年、2010 年、2011 年、2012 年、2013 年、2014 年、2015 年、2016 年、2017 年、2018 年、2019 年
TrinArt 更多細節預設負面提示詞:平塗顏色、平塗陰影
我們建議添加已知的負面提示詞組,以穩定人體結構,例如:糟糕的手部、較少的手指等。
📚 詳細文檔
版權信息
- Sta, AI Novelist Dev (https://ai-novel.com/) @ Bit192, Inc. Twitter https://twitter.com/naclbbr (日語) https://twitter.com/naclbbre (英語)
- Stable Diffusion - Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bjorn
📄 許可證
CreativeML OpenRAIL - M