Shiratakimix
專注於2D繪畫風格的穩定擴散融合模型,提供包含VAE和不含VAE的版本選擇
下載量 531
發布時間 : 4/5/2023
模型概述
ShiratakiMix是一款基於穩定擴散技術的2D繪畫風格生成模型,擅長生成高質量的動漫風格圖像,支持多種場景和風格設置。
模型特點
2D繪畫風格
專注於生成高質量的2D動漫風格圖像
VAE可選
提供包含VAE和不含VAE的模型版本,用戶可根據需求選擇
場景適應性強
能夠生成多種場景下的圖像,包括室內、室外、風景等
模型能力
動漫風格圖像生成
多場景圖像生成
高質量圖像合成
風格化人物創作
使用案例
動漫創作
角色設計
生成各種風格的動漫角色形象
可生成具有不同髮型、服裝和表情的動漫角色
場景繪製
生成動漫風格的背景和場景
可生成室內、室外、風景等多種場景
概念藝術
概念草圖
快速生成動漫風格的概念草圖
可用於遊戲、動畫等項目的早期概念設計
🚀 白滝混合模型(ShiratakiMix)
白滝混合模型(ShiratakiMix)是一款專注於2D畫風的融合模型,能為用戶生成具有獨特風格的圖像。用戶可自由選擇VAE,同時也提供包含VAE的模型版本。
🚀 快速開始
本模型可直接使用,你可以根據自身需求選擇合適的VAE。若需要,也可使用包含VAE的模型版本ShiratakiMix-add-VAE.safetensors
。
✨ 主要特性
- 專注2D畫風:專門針對2D風格進行優化,生成的圖像具有鮮明的2D特色。
- VAE選擇靈活:用戶可根據自己的喜好選擇不同的VAE,也可直接使用包含VAE的模型。
📦 安裝指南
文檔未提及具體安裝步驟,暫不提供相關內容。
💻 使用示例
基礎用法
以下是一些使用本模型生成圖像的示例,包含提示詞、負提示詞以及相關參數設置。
示例1
提示詞:
cute girl,outdoor,scenery
負提示詞:
(easynegative:1.0),(worst quality,low quality:1.2),(bad anatomy:1.4),(realistic:1.1),nose,lips,adult,fat,sad, (inaccurate limb:1.2),extra digit,fewer digits,six fingers,(monochrome:0.95)
步數: 28
採樣器: DPM++ SDE Karras
CFG比例: 7.5
種子: 3585317650
尺寸: 768x544
去噪強度: 0.55
跳過CLIP層: 2
高分辨率放大: 2.5
高分辨率步數: 20
高分辨率上採樣器: Latent
示例2
提示詞:
cute girl,indoors,antique shop,many antique goods,shop counter,display shelf,apron,happy smile,perspective
負提示詞:
(easynegative:1.0),(worst quality,low quality:1.2),(bad anatomy:1.4),(realistic:1.1),nose,lips,adult,fat,sad, (inaccurate limb:1.2),extra digit,fewer digits,six fingers,(monochrome:0.95)
步數: 40
採樣器: DPM++ SDE Karras
CFG比例: 7.5
種子: 4267597555
尺寸: 768x544
去噪強度: 0.55
跳過CLIP層: 2
高分辨率放大: 2.5
高分辨率步數: 20
高分辨率上採樣器: Latent
示例3
提示詞:
cute little girl standing in a Mediterranean port town street,wind,pale-blonde hair, blue eyes,very long twintails,white dress,white hat,blue sky,laugh,double tooth,closed eyes,looking at viewer,lens flare,dramatic, coastal
負提示詞:
(easynegative:1.0),(worst quality,low quality:1.2),(bad anatomy:1.4),(realistic:1.1),nose,lips,adult,fat,sad, (inaccurate limb:1.2),extra digit,fewer digits,six fingers,(monochrome:0.95)
步數: 60
採樣器: DPM++ SDE Karras
CFG比例: 7.5
種子: 265342725
尺寸: 768x544
去噪強度: 0.55
跳過CLIP層: 2
高分辨率放大: 2.5
高分辨率步數: 20
高分辨率上採樣器: Latent
示例4
提示詞:
(solo), cute little (1girl) walking,path,[from below:1.2],brown hair,sine short hair,brown eyes,puddle,Water Reflection,rain,floating water drop,hydrangea,(blurry foreground),dynamic angle,asphalt,(blue sky),lens flare,school uniform,(glitter:1.2)
負提示詞:
(easynegative:1.0),(worst quality,low quality:1.2),(bad anatomy:1.4),(realistic:1.1),nose,lips,adult,fat,sad, (inaccurate limb:1.2),extra digit,fewer digits,six fingers,(monochrome:0.95)
步數: 28
採樣器: DPM++ SDE Karras
CFG比例: 7.5
種子: 415644494
尺寸: 544x768
去噪強度: 0.55
跳過CLIP層: 2
高分辨率放大: 2.5
高分辨率步數: 20
高分辨率上採樣器: Latent
📚 詳細文檔
推薦設置
步數: 20 ~ 60
採樣器: DPM++ SDE Karras
CFG比例: 7.5
去噪強度: 0.55
高分辨率步數: 20
高分辨率上採樣器: Latent 或 R-ESRGAN 4x+ Anime6B
跳過CLIP層: 2
負提示詞:
(easynegative:1.0),(worst quality,low quality:1.2),(bad anatomy:1.4),(realistic:1.1),nose,lips,adult,fat,sad, (inaccurate limb:1.2),extra digit,fewer digits,six fingers,(monochrome:0.95)
模型合併配方
點擊查看模型合併步驟
步驟1 | 分層合併
工具:Merge Block Weighted
模型A | 模型B | 基礎alpha值 | 跳過/重置CLIP位置ID | 合併名稱 |
---|---|---|---|---|
colorBoxModel_colorBOX | IceProllyMix-v1 | 0.42 | None | ShiratakiMix-baseA |
權重:
1,0.9166666667,0.8333333333,0.75,0.6666666667,0.5833333333,0.5,0.4166666667,0.3333333333,0.25,0.1666666667,0.0833333333,
0,
0.0833333333,0.1666666667,0.25,0.3333333333,0.4166666667,0.5,0.5833333333,0.6666666667,0.75,0.8333333333,0.9166666667,1.0
步驟2 | 分層合併
工具:Merge Block Weighted
模型A | 模型B | 基礎alpha值 | 跳過/重置CLIP位置ID | 合併名稱 |
---|---|---|---|---|
Evt_M | ShiratakiMix-baseA | 1.0 | None | ShiratakiMix-baseB |
權重:
1,0.9166666667,0.8333333333,0.75,0.6666666667,0.5833333333,0.5,0.4166666667,0.3333333333,0.25,0.1666666667,0.0833333333,
0,
0.0833333333,0.1666666667,0.25,0.3333333333,0.4166666667,0.5,0.5833333333,0.6666666667,0.75,0.8333333333,0.9166666667,1.0
步驟3 | 分層合併
工具:Toolkit / Merge Block Weighted
◆ 轉換後的模型
SakuraMixV2.ckpt[afbd69c0cd] ==> SakuraMixV2.safetensors[79b4a1d065]
模型A | 模型B | 基礎alpha值 | 跳過/重置CLIP位置ID | 合併名稱 |
---|---|---|---|---|
SakuraMixV2 | ShiratakiMix-baseB | 1.0 | None | ShiratakiMix-baseC |
權重:
1,0.97974537037037,0.921296296296296,0.828125,0.703703703703704,0.55150462962963,0.375,0.177662037037037,0.0370370370370372,0.265625,0.50462962962963,0.750578703703704,
1.0,
0.750578703703704,0.504629629629629,0.265624999999999,0.0370370370370372,0.177662037037038,0.375,0.551504629629631,0.703703703703703,0.828125,0.921296296296298,0.979745370370369,1
步驟4 | 分層合併
工具:Merge Block Weighted
模型A | 模型B | 基礎alpha值 | 跳過/重置CLIP位置ID | 合併名稱 |
---|---|---|---|---|
ShiratakiMix-baseC | BalorMix-V4.2featACT | 0.05 | None | ShiratakiMix |
權重:
0.1,0.1,0,0,0,0,0,0,0.1,0.1,0,0,0,0.1,0.1,0,0,0,0,0,0,0,0,0.1,0.1
合併結果:ShiratakiMix.safetensors [d3849c69d9]
步驟5 | 修復
工具:Toolkit
不包含垃圾數據。CLIP位置存在錯誤,已修復:7, 14, 19, 28, 33, 38, 43, 56, 61。
模型將進行修復(9處更改)。
修復結果:ShiratakiMix-fixed.safetensors [ded0c94f95]
模型合併來源
- Color Box Model / CreativeML OpenRAIL M
- colorBoxModel_colorBOX
- ProllyMix / CreativeML OpenRAIL M
- IceProllyMix-v1
- Evt_M / CreativeML OpenRAIL M
- Evt_M_fp16
- SakuraMix / CreativeML OpenRAIL M
- SakuraMix-v2
- BalorMix-V4 / CreativeML OpenRAIL M
- BalorMix-V4.2featACT
🔧 技術細節
文檔未提及具體技術細節,暫不提供相關內容。
📄 許可證
本模型採用 CreativeML OpenRAIL-M 許可證,具體規定如下:
許可情況 | 詳情 |
---|---|
✅ | 可以在不提及模型創建者的情況下使用該模型。 |
✅ | 可以將使用該模型生成的圖像用於商業用途。 |
✅ | 可以將該模型用於商業圖像生成服務。 |
✅ | 可以分享使用該模型合併的模型。 |
✅ | 不可以出售該模型或使用該模型合併的模型。 |
✅ | 不可以為使用該模型合併的模型設置不同的權限。 |
此外,使用本模型還需遵守以下規定:
- 不得使用該模型故意生成或分享非法或有害的輸出或內容。
- 模型創建者對用戶生成的輸出不主張任何權利,用戶可自由使用這些輸出,但需對其使用負責,且使用不得違反許可證的規定。
- 可以重新分發模型權重,並將模型用於商業用途或作為服務使用。但需注意,必須包含與許可證中相同的使用限制,並向所有用戶分享一份 CreativeML OpenRAIL-M 許可證副本(請完整、仔細閱讀許可證)。
完整許可證請見:https://huggingface.co/spaces/CompVis/stable-diffusion-license
🌐 相關鏈接
- Twitter: @Vsukiyaki_AIArt
模型效果展示
Stable Diffusion V1 5
Openrail
穩定擴散是一種潛在的文本到圖像擴散模型,能夠根據任何文本輸入生成逼真的圖像。
圖像生成
S
stable-diffusion-v1-5
3.7M
518
Stable Diffusion Inpainting
Openrail
基於穩定擴散的文本到圖像生成模型,具備圖像修復能力
圖像生成
S
stable-diffusion-v1-5
3.3M
56
Stable Diffusion Xl Base 1.0
SDXL 1.0是基於擴散的文本生成圖像模型,採用專家集成的潛在擴散流程,支持高分辨率圖像生成
圖像生成
S
stabilityai
2.4M
6,545
Stable Diffusion V1 4
Openrail
穩定擴散是一種潛在文本到圖像擴散模型,能夠根據任意文本輸入生成逼真圖像。
圖像生成
S
CompVis
1.7M
6,778
Stable Diffusion Xl Refiner 1.0
SD-XL 1.0優化器模型是Stability AI開發的圖像生成模型,專為提升SDXL基礎模型生成的圖像質量而設計,特別擅長最終去噪步驟處理。
圖像生成
S
stabilityai
1.1M
1,882
Stable Diffusion 2 1
基於擴散的文本生成圖像模型,支持通過文本提示生成和修改圖像
圖像生成
S
stabilityai
948.75k
3,966
Stable Diffusion Xl 1.0 Inpainting 0.1
基於Stable Diffusion XL的潛在文本到圖像擴散模型,具備通過遮罩進行圖像修復的功能
圖像生成
S
diffusers
673.14k
334
Stable Diffusion 2 Base
基於擴散的文生圖模型,可根據文本提示生成高質量圖像
圖像生成
S
stabilityai
613.60k
349
Playground V2.5 1024px Aesthetic
其他
開源文生圖模型,能生成1024x1024分辨率及多種縱橫比的美學圖像,在美學質量上處於開源領域領先地位。
圖像生成
P
playgroundai
554.94k
723
Sd Turbo
SD-Turbo是一款高速文本生成圖像模型,僅需單次網絡推理即可根據文本提示生成逼真圖像。該模型作為研究原型發佈,旨在探索小型蒸餾文本生成圖像模型。
圖像生成
S
stabilityai
502.82k
380
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98