🚀 RouWei-0.8 文本到图像模型
RouWei-0.8 是一款基于 Illustrious 进行深度再训练的文本到图像模型,它能高度贴合提示词,拥有丰富知识储备,在性能上达到了先进水平。该模型使用了精心挑选和平衡的 1300 万张独特图片数据集进行训练,涵盖动漫艺术、封面、数字插画等多种来源。

🚀 快速开始
本模型基于 Illustrious 进行深度再训练,使用了 1300 万张独特图片(约 400 万带有自然文本描述)的数据集,这些数据从超过 2500 万张动漫艺术、封面、数字插画、西方媒体等来源中挑选和平衡而来,包括私有数据集。在 Civitai 上查看更详细描述
Vpred 版本
Vpred 版本即将推出。
✨ 主要特性
- 知识丰富:对角色、概念、风格、文化等相关事物有全新且广泛的认知。
- 提示贴合度高:在发布时,是 SDXL 动漫模型中提示贴合度最佳的模型。
- 解决常见问题:解决了 Illustrious、NoobAi 等检查点常见的标签渗透和偏差问题。
- 美学与风格多样:在广泛的风格(超过 50000 位艺术家,包括从私有画廊精心挑选的数百个独特数据集,其中一些直接来自艺术家本人)中都有出色的美学表现和知识储备。
- 高灵活性与多样性:在不牺牲稳定性的前提下,具有高度的灵活性和多样性。
- 无水印困扰:由于使用了干净的数据集,热门风格不再有烦人的水印。
- 色彩表现出色:色彩鲜艳,渐变平滑,无过曝痕迹,即使使用 epsilon 也能呈现完整色域。
- 纯净训练:完全从 Illustrious v0.1 开始训练,不涉及第三方检查点、Loras、调整器等。
数据集截止日期为 2025 年 4 月底。
📚 详细文档
特性与提示
重要更改
当你提示艺术家风格,尤其是混合多种风格时,它们的标签必须放在单独的 CLIP 块中。在其后添加 BREAK
(适用于 A1111 及其衍生版本),使用条件拼接节点(适用于 Comfy),或者至少将它们放在最后。否则,结果可能会显著下降。
该模型既可以使用基于短 booru 标签的提示,也可以使用长而复杂的自然文本提示。结合标签和一些自然文本短语可以获得最佳效果。对于标签,使用了经典的 danbooru 风格、无下划线的逗号分隔标签。
基本设置
- 图像分辨率:txt2img 约 1 - 1.5 兆像素,任意长宽比,分辨率为 64 的倍数(如 1024x1024、1152x、1216x832 等)。
- 采样器:Euler_a
- CFG 值:epsilon 版本为 4 - 8,vpred 版本为 3 - 5
- 步数:20 - 28 步
- 其他:LCM/PCM/DMD 未测试,cfg++ 采样器工作正常,部分调度器不工作。高分辨率修复:x1.5 潜在空间 + 去噪 0.6 或任何 gan + 去噪 0.3 - 0.55。
请注意,vpred 版本需要较低的 CFG 值。
示例可在仓库中找到,更多示例请查看 civitai。
质量标签
- 正标签:
masterpiece, best quality
- 负标签:
low quality, worst quality
除 low quality
外,负标签中的其他标签均可省略。像 lowres 这样的元标签已被移除,请勿使用。低分辨率图像根据其重要性已被移除或使用 DAT 进行了上采样和清理。
负提示
worst quality, low quality, watermark
为获得最佳效果,请尽量保持负提示简洁。滥用流行序列不会改善结果,因为所有相关缺陷已得到解决,但可能会导致不必要的效果、偏差和质量下降。
艺术家风格
该模型了解超过 35000 种艺术家风格。列表,在 Mega 上查看示例网格。使用时需加上 by
,否则可能无法正常工作。
通用风格
2.5d, anime screencap, bold line, sketch, cgi, digital painting, flat colors, smooth shading, minimalistic, ink style, oil style, pastel style
自然文本
该模型可以结合 booru 标签和自然文本提示使用,将标签和一些自然文本短语结合使用可获得最佳效果。约 400 万张数据集中的图片带有由 Claude、GPT、Gemini 和 ToriiGate 生成的混合自然文本描述。
0.8 版本对自然文本提示有更高级的理解,在 SDXL 动漫模型中表现出色。但这并不意味着你必须使用自然语言提示,仅使用标签也是完全可以的,因为模型对标签组合的理解也有所提高。
亮度/颜色/对比度
你可以使用额外的元标签来控制亮度、颜色和对比度:
low brightness, high brightness, low saturation, high saturation, low gamma, high gamma, sharp colors, soft colors, hdr, sdr
Vpred 版本
RouWei-0.8 的 Vpred 版本即将推出。
基础模型和浮点版本
你可以使用 FP32 版本 进行更精确的合并,或者在 Comfy 中以 fp32 模式使用文本编码器以获得一些优势。
Epsilon 和 vpred 版本在主要训练后进行了简要的美学优化,以改善细节和连贯性。如果你想在合并、提取或微调 RouWei 时不考虑这些后期优化,可以使用 RouWei 的基础版本:FP16 FP32
其他信息
Discord 服务器
加入
安全性
该模型可能会根据相应提示生成 NSFW 图像,请考虑添加额外的过滤机制。输出结果可能不准确或具有挑衅性,请勿将其作为参考。
许可证
与 illustrious 相同,请查看原始页面了解限制。你可以自由地在合并、微调等操作中使用该模型,但请保留链接。
致谢
感谢许多匿名人士、Bakariso、dga、Fi.、ello、K.、LOL2024、NeuroSenko、rred、Soviet Cat、Sv1.、T.、TekeshiX 等提供帮助的伙伴。
捐赠
- BTC:bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c
- ETH/USDT(e):0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db
- XMR:47F7JAyKP8tMBtzwxpoZsUVB8wzg2VrbtDKBice9FAS1FikbHEXXPof4PAb42CQ5ch8p8Hs4RvJuzPHDtaVSdQzD6ZbA5TZ
信息表格
属性 |
详情 |
模型类型 |
文本到图像 |
基础模型 |
Minthy/RouWei-0.7 |
库名称 |
diffusers |
标签 |
anime |
重要提示
⚠️ 重要提示
当提示艺术家风格,尤其是混合多种风格时,它们的标签必须放在单独的 CLIP 块中,否则结果可能会显著下降。
💡 使用建议
结合标签和自然文本短语使用该模型可获得最佳效果;使用额外的元标签可控制图像的亮度、颜色和对比度。