Shiratakimix
专注于2D绘画风格的稳定扩散融合模型,提供包含VAE和不含VAE的版本选择
下载量 531
发布时间 : 4/5/2023
模型简介
ShiratakiMix是一款基于稳定扩散技术的2D绘画风格生成模型,擅长生成高质量的动漫风格图像,支持多种场景和风格设置。
模型特点
2D绘画风格
专注于生成高质量的2D动漫风格图像
VAE可选
提供包含VAE和不含VAE的模型版本,用户可根据需求选择
场景适应性强
能够生成多种场景下的图像,包括室内、室外、风景等
模型能力
动漫风格图像生成
多场景图像生成
高质量图像合成
风格化人物创作
使用案例
动漫创作
角色设计
生成各种风格的动漫角色形象
可生成具有不同发型、服装和表情的动漫角色
场景绘制
生成动漫风格的背景和场景
可生成室内、室外、风景等多种场景
概念艺术
概念草图
快速生成动漫风格的概念草图
可用于游戏、动画等项目的早期概念设计
🚀 白滝混合模型(ShiratakiMix)
白滝混合模型(ShiratakiMix)是一款专注于2D画风的融合模型,能为用户生成具有独特风格的图像。用户可自由选择VAE,同时也提供包含VAE的模型版本。
🚀 快速开始
本模型可直接使用,你可以根据自身需求选择合适的VAE。若需要,也可使用包含VAE的模型版本ShiratakiMix-add-VAE.safetensors
。
✨ 主要特性
- 专注2D画风:专门针对2D风格进行优化,生成的图像具有鲜明的2D特色。
- VAE选择灵活:用户可根据自己的喜好选择不同的VAE,也可直接使用包含VAE的模型。
📦 安装指南
文档未提及具体安装步骤,暂不提供相关内容。
💻 使用示例
基础用法
以下是一些使用本模型生成图像的示例,包含提示词、负提示词以及相关参数设置。
示例1
提示词:
cute girl,outdoor,scenery
负提示词:
(easynegative:1.0),(worst quality,low quality:1.2),(bad anatomy:1.4),(realistic:1.1),nose,lips,adult,fat,sad, (inaccurate limb:1.2),extra digit,fewer digits,six fingers,(monochrome:0.95)
步数: 28
采样器: DPM++ SDE Karras
CFG比例: 7.5
种子: 3585317650
尺寸: 768x544
去噪强度: 0.55
跳过CLIP层: 2
高分辨率放大: 2.5
高分辨率步数: 20
高分辨率上采样器: Latent
示例2
提示词:
cute girl,indoors,antique shop,many antique goods,shop counter,display shelf,apron,happy smile,perspective
负提示词:
(easynegative:1.0),(worst quality,low quality:1.2),(bad anatomy:1.4),(realistic:1.1),nose,lips,adult,fat,sad, (inaccurate limb:1.2),extra digit,fewer digits,six fingers,(monochrome:0.95)
步数: 40
采样器: DPM++ SDE Karras
CFG比例: 7.5
种子: 4267597555
尺寸: 768x544
去噪强度: 0.55
跳过CLIP层: 2
高分辨率放大: 2.5
高分辨率步数: 20
高分辨率上采样器: Latent
示例3
提示词:
cute little girl standing in a Mediterranean port town street,wind,pale-blonde hair, blue eyes,very long twintails,white dress,white hat,blue sky,laugh,double tooth,closed eyes,looking at viewer,lens flare,dramatic, coastal
负提示词:
(easynegative:1.0),(worst quality,low quality:1.2),(bad anatomy:1.4),(realistic:1.1),nose,lips,adult,fat,sad, (inaccurate limb:1.2),extra digit,fewer digits,six fingers,(monochrome:0.95)
步数: 60
采样器: DPM++ SDE Karras
CFG比例: 7.5
种子: 265342725
尺寸: 768x544
去噪强度: 0.55
跳过CLIP层: 2
高分辨率放大: 2.5
高分辨率步数: 20
高分辨率上采样器: Latent
示例4
提示词:
(solo), cute little (1girl) walking,path,[from below:1.2],brown hair,sine short hair,brown eyes,puddle,Water Reflection,rain,floating water drop,hydrangea,(blurry foreground),dynamic angle,asphalt,(blue sky),lens flare,school uniform,(glitter:1.2)
负提示词:
(easynegative:1.0),(worst quality,low quality:1.2),(bad anatomy:1.4),(realistic:1.1),nose,lips,adult,fat,sad, (inaccurate limb:1.2),extra digit,fewer digits,six fingers,(monochrome:0.95)
步数: 28
采样器: DPM++ SDE Karras
CFG比例: 7.5
种子: 415644494
尺寸: 544x768
去噪强度: 0.55
跳过CLIP层: 2
高分辨率放大: 2.5
高分辨率步数: 20
高分辨率上采样器: Latent
📚 详细文档
推荐设置
步数: 20 ~ 60
采样器: DPM++ SDE Karras
CFG比例: 7.5
去噪强度: 0.55
高分辨率步数: 20
高分辨率上采样器: Latent 或 R-ESRGAN 4x+ Anime6B
跳过CLIP层: 2
负提示词:
(easynegative:1.0),(worst quality,low quality:1.2),(bad anatomy:1.4),(realistic:1.1),nose,lips,adult,fat,sad, (inaccurate limb:1.2),extra digit,fewer digits,six fingers,(monochrome:0.95)
模型合并配方
点击查看模型合并步骤
步骤1 | 分层合并
工具:Merge Block Weighted
模型A | 模型B | 基础alpha值 | 跳过/重置CLIP位置ID | 合并名称 |
---|---|---|---|---|
colorBoxModel_colorBOX | IceProllyMix-v1 | 0.42 | None | ShiratakiMix-baseA |
权重:
1,0.9166666667,0.8333333333,0.75,0.6666666667,0.5833333333,0.5,0.4166666667,0.3333333333,0.25,0.1666666667,0.0833333333,
0,
0.0833333333,0.1666666667,0.25,0.3333333333,0.4166666667,0.5,0.5833333333,0.6666666667,0.75,0.8333333333,0.9166666667,1.0
步骤2 | 分层合并
工具:Merge Block Weighted
模型A | 模型B | 基础alpha值 | 跳过/重置CLIP位置ID | 合并名称 |
---|---|---|---|---|
Evt_M | ShiratakiMix-baseA | 1.0 | None | ShiratakiMix-baseB |
权重:
1,0.9166666667,0.8333333333,0.75,0.6666666667,0.5833333333,0.5,0.4166666667,0.3333333333,0.25,0.1666666667,0.0833333333,
0,
0.0833333333,0.1666666667,0.25,0.3333333333,0.4166666667,0.5,0.5833333333,0.6666666667,0.75,0.8333333333,0.9166666667,1.0
步骤3 | 分层合并
工具:Toolkit / Merge Block Weighted
◆ 转换后的模型
SakuraMixV2.ckpt[afbd69c0cd] ==> SakuraMixV2.safetensors[79b4a1d065]
模型A | 模型B | 基础alpha值 | 跳过/重置CLIP位置ID | 合并名称 |
---|---|---|---|---|
SakuraMixV2 | ShiratakiMix-baseB | 1.0 | None | ShiratakiMix-baseC |
权重:
1,0.97974537037037,0.921296296296296,0.828125,0.703703703703704,0.55150462962963,0.375,0.177662037037037,0.0370370370370372,0.265625,0.50462962962963,0.750578703703704,
1.0,
0.750578703703704,0.504629629629629,0.265624999999999,0.0370370370370372,0.177662037037038,0.375,0.551504629629631,0.703703703703703,0.828125,0.921296296296298,0.979745370370369,1
步骤4 | 分层合并
工具:Merge Block Weighted
模型A | 模型B | 基础alpha值 | 跳过/重置CLIP位置ID | 合并名称 |
---|---|---|---|---|
ShiratakiMix-baseC | BalorMix-V4.2featACT | 0.05 | None | ShiratakiMix |
权重:
0.1,0.1,0,0,0,0,0,0,0.1,0.1,0,0,0,0.1,0.1,0,0,0,0,0,0,0,0,0.1,0.1
合并结果:ShiratakiMix.safetensors [d3849c69d9]
步骤5 | 修复
工具:Toolkit
不包含垃圾数据。CLIP位置存在错误,已修复:7, 14, 19, 28, 33, 38, 43, 56, 61。
模型将进行修复(9处更改)。
修复结果:ShiratakiMix-fixed.safetensors [ded0c94f95]
模型合并来源
- Color Box Model / CreativeML OpenRAIL M
- colorBoxModel_colorBOX
- ProllyMix / CreativeML OpenRAIL M
- IceProllyMix-v1
- Evt_M / CreativeML OpenRAIL M
- Evt_M_fp16
- SakuraMix / CreativeML OpenRAIL M
- SakuraMix-v2
- BalorMix-V4 / CreativeML OpenRAIL M
- BalorMix-V4.2featACT
🔧 技术细节
文档未提及具体技术细节,暂不提供相关内容。
📄 许可证
本模型采用 CreativeML OpenRAIL-M 许可证,具体规定如下:
许可情况 | 详情 |
---|---|
✅ | 可以在不提及模型创建者的情况下使用该模型。 |
✅ | 可以将使用该模型生成的图像用于商业用途。 |
✅ | 可以将该模型用于商业图像生成服务。 |
✅ | 可以分享使用该模型合并的模型。 |
✅ | 不可以出售该模型或使用该模型合并的模型。 |
✅ | 不可以为使用该模型合并的模型设置不同的权限。 |
此外,使用本模型还需遵守以下规定:
- 不得使用该模型故意生成或分享非法或有害的输出或内容。
- 模型创建者对用户生成的输出不主张任何权利,用户可自由使用这些输出,但需对其使用负责,且使用不得违反许可证的规定。
- 可以重新分发模型权重,并将模型用于商业用途或作为服务使用。但需注意,必须包含与许可证中相同的使用限制,并向所有用户分享一份 CreativeML OpenRAIL-M 许可证副本(请完整、仔细阅读许可证)。
完整许可证请见:https://huggingface.co/spaces/CompVis/stable-diffusion-license
🌐 相关链接
- Twitter: @Vsukiyaki_AIArt
模型效果展示
Stable Diffusion V1 5
Openrail
稳定扩散是一种潜在的文本到图像扩散模型,能够根据任何文本输入生成逼真的图像。
图像生成
S
stable-diffusion-v1-5
3.7M
518
Stable Diffusion Inpainting
Openrail
基于稳定扩散的文本到图像生成模型,具备图像修复能力
图像生成
S
stable-diffusion-v1-5
3.3M
56
Stable Diffusion Xl Base 1.0
SDXL 1.0是基于扩散的文本生成图像模型,采用专家集成的潜在扩散流程,支持高分辨率图像生成
图像生成
S
stabilityai
2.4M
6,545
Stable Diffusion V1 4
Openrail
稳定扩散是一种潜在文本到图像扩散模型,能够根据任意文本输入生成逼真图像。
图像生成
S
CompVis
1.7M
6,778
Stable Diffusion Xl Refiner 1.0
SD-XL 1.0优化器模型是Stability AI开发的图像生成模型,专为提升SDXL基础模型生成的图像质量而设计,特别擅长最终去噪步骤处理。
图像生成
S
stabilityai
1.1M
1,882
Stable Diffusion 2 1
基于扩散的文本生成图像模型,支持通过文本提示生成和修改图像
图像生成
S
stabilityai
948.75k
3,966
Stable Diffusion Xl 1.0 Inpainting 0.1
基于Stable Diffusion XL的潜在文本到图像扩散模型,具备通过遮罩进行图像修复的功能
图像生成
S
diffusers
673.14k
334
Stable Diffusion 2 Base
基于扩散的文生图模型,可根据文本提示生成高质量图像
图像生成
S
stabilityai
613.60k
349
Playground V2.5 1024px Aesthetic
其他
开源文生图模型,能生成1024x1024分辨率及多种纵横比的美学图像,在美学质量上处于开源领域领先地位。
图像生成
P
playgroundai
554.94k
723
Sd Turbo
SD-Turbo是一款高速文本生成图像模型,仅需单次网络推理即可根据文本提示生成逼真图像。该模型作为研究原型发布,旨在探索小型蒸馏文本生成图像模型。
图像生成
S
stabilityai
502.82k
380
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98