🚀 UrangDiffusion 2.0
UrangDiffusion 2.0(oo - raw - ng Diffusion)與 v1.4 相比,帶來了全新的訓練方法。該模型提供了更高的靈活性,並引入了一些更新的數據集。
🚀 快速開始
標準提示準則
此模型是基於 Animagine XL 3.1 進行微調的。不過,數據集的標註有一些小變化,因此使用了不同的默認提示:
默認提示:
1girl/1boy, character name, from what series, everything else in any order, best quality, amazing quality, very aesthetic.
注意:由於報告稱質量標籤 masterpiece
經常會導致不必要的副作用,因此已將其替換為 best quality
。測試還證明,該標籤會導致一些生成結果的解剖結構出現問題。
默認負向提示:
lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract],
默認配置:
默認配置為 Euler a,步數約為 25 - 30,CFG 為 5 - 7,ENSD 設置為 31337。最佳參數約為 28 步 和 CFG 7。
✨ 主要特性
- 全新訓練方法:與 v1.4 相比,帶來了全新的訓練方法,提供更高靈活性。
- 更新數據集:引入了一些更新的數據集。
📦 安裝指南
文檔未提供安裝步驟,故跳過此章節。
💻 使用示例
文檔未提供代碼示例,故跳過此章節。
📚 詳細文檔
訓練配置
預訓練:
- 數據集大小:44,393 張圖像
- GPU:1xA100
- 優化器:AdaFactor
- Unet 學習率:3.75e - 6
- 文本編碼器學習率:1.875e - 6
- 批次大小:16
- 梯度累積:3
- 熱身步數:100 步
- 最小 SNR Gamma:5
- 輪數:10
- 隨機裁剪:是
- 損失函數:Huber
- Huber 調度:SNR
- Huber C:0.1
微調:
- 數據集大小:3,140 張圖像
- GPU:1xA100
- 優化器:AdaFactor
- Unet 學習率:3e - 6
- 文本編碼器學習率:-(文本編碼器訓練設置為 False)
- 批次大小:16
- 梯度累積:3
- 熱身步數:5%
- 最小 SNR Gamma:5
- 輪數:10(使用第 9 輪)
- 噪聲偏移:0.0357
- 隨機裁剪:是
- 損失函數:Huber
- Huber 調度:SNR
- Huber C:0.1
新增/更新的系列和角色
系列
- 崩壞:星穹鐵道
- 鳴潮
- 搖曳莊的幽奈小姐
崩壞:星穹鐵道角色
- 螢火蟲
- 阿喀琉斯
- 斯帕克
- 羅賓
- 砂金
- 黑天鵝
- 飛霄
- 雲璃
- 靈莎
- 三月七(巡獵)
- 玉
- 姣囚
- 加拉格爾
- 拉帕
- 米莎
Hololive 主播
- Hololive 印尼分部
- 拉奧拉·潘特拉
- 伊麗莎白·羅斯·血焰
- 吉吉·穆林
- 塞西莉亞·伊默格林
原神角色
- 阿蕾奇諾
- 克洛琳德
- 千代
- 穆阿拉尼
- 閒雲
- 西格溫妮
- 基尼奇
- 希洛嫩
- 艾米莉
- 遊戲
- 卡奇娜
- 塞託斯
其他
- 風景
- 用於修復解剖結構問題的幾個概念
特別感謝
- CagliostroLab:贊助了模型的微調,允許借用該組織的 RunPod 賬戶。
- CagliostroLab 的同事們:提供了見解和反饋。
- Nur Hikari 和 Vanilla Latte:進行質量控制。
- Linaqruf:在 AI 生成圖像方面是導師和榜樣,也是標籤排序的幕後功臣。
📄 許可證
UrangDiffusion 2.0 遵循 公平人工智能公共許可證 1.0 - SD。