🚀 Stable Diffusion TrinArt Characters model v1
Stable Diffusion TrinArt Characters model v1 是基于 Stable Diffusion v1 的模型,使用约 1920 万张动漫风格图像(包括预卷增强图像)进行训练,并最终使用约 5 万张图像进行微调。该模型旨在在 SDv1 给定的模型规格内,寻求艺术风格多样性和解剖学质量之间的平衡点。
🚀 快速开始
此模型已发布新版本:
https://huggingface.co/naclbit/trinart_derrida_characters_v2_stable_diffusion
✨ 主要特性
训练数据
trinart_characters_19.2m_stable_diffusion_v1 基于约 1920 万张动漫风格图像(包括预卷增强图像)进行训练,并最终使用约 5 万张图像进行微调。
硬件要求
自定义自编码器
注意:2022 年 11 月 5 日之前上传的检查点有误,该文件已替换为最新检查点。
我们还为自定义 KL 自编码器提供了单独的检查点。正如潜扩散论文所建议的,我们发现分别训练自编码器和潜扩散模型可以改善结果。由于官方的稳定扩散脚本不支持加载其他 VAE,为了在你的脚本中运行它,你需要覆盖 first_stage_model 的 state_dict。
流行的 WebUI 有加载单独的 first_stage_model 参数的脚本。
安全性
数据集经过过滤,排除了 NSFW 或不安全内容。经过我们对 1000 多万张用户生成图像的广泛实验和测试,我们认为该模型足够安全,与原始的 SD v1.4 模型或其他动漫模型相比,不太可能生成有问题(裸露、过度色情、逼真血腥)的内容。然而,如果用户对该模型进行足够的“折磨”,仍有可能迫使该模型生成令人反感的材料。我们不认为该模型 100% 无风险。
*本声明并不一定限制第三方训练包含 NSFW 内容的此模型的衍生版本。
💻 使用示例
基础用法
以下图像是由原生 TrinArt 服务直接生成的,使用了其特有的上采样器、解析器和处理流程。实际效果可能会有所不同。
(各种随机示例)
全景、高质量、htgngg 动物扶手、棕色头发、欢乐的椅子、杯子、连衣裙、花朵、从上往下看、肩上搭着夹克、长发、独自坐着、糖碗、奇幻冒险家旅馆桌子、茶杯、茶壶、风景、微缩景观(2022 艺术风格预设)
高分辨率全景、齐刘海、裸露肩膀、水鸟笼、玻璃容器、分离式袖子、褶边、褶边腿部服饰、褶边装饰、发饰、发带、兜帽、长发、中等胸部、丝带、过膝袜(2019 艺术风格预设)
1 个女孩站立、手持剑、手臂举起、齐刘海、裸露肩膀、靴子、蝴蝶结、胸部、明亮的瞳孔、项圈、分离式袖子、菱形(形状)、漂浮、漂浮的头发、鞋上的蝴蝶结、从侧面看、全身、手套、腿抬起、长发、看着观众、张嘴、伸展的手臂、独自、有条纹的头发、齐刘海向后梳、双色头发、非常长的头发::4 愤怒::1(2022 艺术风格预设)
1 个男孩、男性焦点、站立、手持剑、手臂举起、蝴蝶结、明亮的瞳孔、披风、外套、菱形(形状)、漂浮、漂浮的头发、翻边靴子、鞋上的蝴蝶结、从侧面看、全身、手套、腿抬起、长袖、看着观众、张嘴、伸展的手臂、敞开的外套、敞开的衣服、独自、齐刘海向后梳、双色头发、大腿靴::4 愤怒::1.25(2022 艺术风格预设)
大教堂、1 个女学生、桃子头造型、校服、猫、粒子、美丽的流星、详细的大教堂、张嘴、眼镜、猫(2022 艺术风格预设)
高分辨率、2 个女孩、百合、全景、齐刘海、裸露肩膀、水鸟笼、玻璃容器、分离式袖子、褶边、褶边腿部服饰、褶边装饰、发饰、发带、兜帽、长发、中等胸部、丝带、过膝袜(更多细节预设)
全景、最佳质量、青金石、高分辨率、1 个男孩、齐刘海、黑色手套、棕色头发、闭嘴、眼睛间的头发、看着观众、男性焦点、花朵、绿色眼睛(更多细节预设)
TrinArt 2022 艺术风格预设负面提示词:复古风格、20 世纪 80 年代、20 世纪 90 年代、2000 年代、2005 年、2006 年、2007 年、2008 年、2009 年、2010 年、2011 年、2012 年、2013 年、2014 年、2015 年、2016 年、2017 年、2018 年、2019 年
TrinArt 更多细节预设负面提示词:平涂颜色、平涂阴影
我们建议添加已知的负面提示词组,以稳定人体结构,例如:糟糕的手部、较少的手指等。
📚 详细文档
版权信息
- Sta, AI Novelist Dev (https://ai-novel.com/) @ Bit192, Inc. Twitter https://twitter.com/naclbbr (日语) https://twitter.com/naclbbre (英语)
- Stable Diffusion - Rombach, Robin and Blattmann, Andreas and Lorenz, Dominik and Esser, Patrick and Ommer, Bjorn
📄 许可证
CreativeML OpenRAIL - M