🚀 UrangDiffusion 2.0
UrangDiffusion 2.0(oo - raw - ng Diffusion)与 v1.4 相比,带来了全新的训练方法。该模型提供了更高的灵活性,并引入了一些更新的数据集。
🚀 快速开始
标准提示准则
此模型是基于 Animagine XL 3.1 进行微调的。不过,数据集的标注有一些小变化,因此使用了不同的默认提示:
默认提示:
1girl/1boy, character name, from what series, everything else in any order, best quality, amazing quality, very aesthetic.
注意:由于报告称质量标签 masterpiece
经常会导致不必要的副作用,因此已将其替换为 best quality
。测试还证明,该标签会导致一些生成结果的解剖结构出现问题。
默认负向提示:
lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality, watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits, artistic error, username, scan, [abstract],
默认配置:
默认配置为 Euler a,步数约为 25 - 30,CFG 为 5 - 7,ENSD 设置为 31337。最佳参数约为 28 步 和 CFG 7。
✨ 主要特性
- 全新训练方法:与 v1.4 相比,带来了全新的训练方法,提供更高灵活性。
- 更新数据集:引入了一些更新的数据集。
📦 安装指南
文档未提供安装步骤,故跳过此章节。
💻 使用示例
文档未提供代码示例,故跳过此章节。
📚 详细文档
训练配置
预训练:
- 数据集大小:44,393 张图像
- GPU:1xA100
- 优化器:AdaFactor
- Unet 学习率:3.75e - 6
- 文本编码器学习率:1.875e - 6
- 批次大小:16
- 梯度累积:3
- 热身步数:100 步
- 最小 SNR Gamma:5
- 轮数:10
- 随机裁剪:是
- 损失函数:Huber
- Huber 调度:SNR
- Huber C:0.1
微调:
- 数据集大小:3,140 张图像
- GPU:1xA100
- 优化器:AdaFactor
- Unet 学习率:3e - 6
- 文本编码器学习率:-(文本编码器训练设置为 False)
- 批次大小:16
- 梯度累积:3
- 热身步数:5%
- 最小 SNR Gamma:5
- 轮数:10(使用第 9 轮)
- 噪声偏移:0.0357
- 随机裁剪:是
- 损失函数:Huber
- Huber 调度:SNR
- Huber C:0.1
新增/更新的系列和角色
系列
- 崩坏:星穹铁道
- 鸣潮
- 摇曳庄的幽奈小姐
崩坏:星穹铁道角色
- 萤火虫
- 阿喀琉斯
- 斯帕克
- 罗宾
- 砂金
- 黑天鹅
- 飞霄
- 云璃
- 灵莎
- 三月七(巡猎)
- 玉
- 姣囚
- 加拉格尔
- 拉帕
- 米莎
Hololive 主播
- Hololive 印尼分部
- 拉奥拉·潘特拉
- 伊丽莎白·罗斯·血焰
- 吉吉·穆林
- 塞西莉亚·伊默格林
原神角色
- 阿蕾奇诺
- 克洛琳德
- 千代
- 穆阿拉尼
- 闲云
- 西格温妮
- 基尼奇
- 希洛嫩
- 艾米莉
- 游戏
- 卡奇娜
- 塞托斯
其他
- 风景
- 用于修复解剖结构问题的几个概念
特别感谢
- CagliostroLab:赞助了模型的微调,允许借用该组织的 RunPod 账户。
- CagliostroLab 的同事们:提供了见解和反馈。
- Nur Hikari 和 Vanilla Latte:进行质量控制。
- Linaqruf:在 AI 生成图像方面是导师和榜样,也是标签排序的幕后功臣。
📄 许可证
UrangDiffusion 2.0 遵循 公平人工智能公共许可证 1.0 - SD。