🚀 RouWei-0.8 文本到圖像模型
RouWei-0.8 是一款基於 Illustrious 進行深度再訓練的文本到圖像模型,它能高度貼合提示詞,擁有豐富知識儲備,在性能上達到了先進水平。該模型使用了精心挑選和平衡的 1300 萬張獨特圖片數據集進行訓練,涵蓋動漫藝術、封面、數字插畫等多種來源。

🚀 快速開始
本模型基於 Illustrious 進行深度再訓練,使用了 1300 萬張獨特圖片(約 400 萬帶有自然文本描述)的數據集,這些數據從超過 2500 萬張動漫藝術、封面、數字插畫、西方媒體等來源中挑選和平衡而來,包括私有數據集。在 Civitai 上查看更詳細描述
Vpred 版本
Vpred 版本即將推出。
✨ 主要特性
- 知識豐富:對角色、概念、風格、文化等相關事物有全新且廣泛的認知。
- 提示貼合度高:在發佈時,是 SDXL 動漫模型中提示貼合度最佳的模型。
- 解決常見問題:解決了 Illustrious、NoobAi 等檢查點常見的標籤滲透和偏差問題。
- 美學與風格多樣:在廣泛的風格(超過 50000 位藝術家,包括從私有畫廊精心挑選的數百個獨特數據集,其中一些直接來自藝術家本人)中都有出色的美學表現和知識儲備。
- 高靈活性與多樣性:在不犧牲穩定性的前提下,具有高度的靈活性和多樣性。
- 無水印困擾:由於使用了乾淨的數據集,熱門風格不再有煩人的水印。
- 色彩表現出色:色彩鮮豔,漸變平滑,無過曝痕跡,即使使用 epsilon 也能呈現完整色域。
- 純淨訓練:完全從 Illustrious v0.1 開始訓練,不涉及第三方檢查點、Loras、調整器等。
數據集截止日期為 2025 年 4 月底。
📚 詳細文檔
特性與提示
重要更改
當你提示藝術家風格,尤其是混合多種風格時,它們的標籤必須放在單獨的 CLIP 塊中。在其後添加 BREAK
(適用於 A1111 及其衍生版本),使用條件拼接節點(適用於 Comfy),或者至少將它們放在最後。否則,結果可能會顯著下降。
該模型既可以使用基於短 booru 標籤的提示,也可以使用長而複雜的自然文本提示。結合標籤和一些自然文本短語可以獲得最佳效果。對於標籤,使用了經典的 danbooru 風格、無下劃線的逗號分隔標籤。
基本設置
- 圖像分辨率:txt2img 約 1 - 1.5 兆像素,任意長寬比,分辨率為 64 的倍數(如 1024x1024、1152x、1216x832 等)。
- 採樣器:Euler_a
- CFG 值:epsilon 版本為 4 - 8,vpred 版本為 3 - 5
- 步數:20 - 28 步
- 其他:LCM/PCM/DMD 未測試,cfg++ 採樣器工作正常,部分調度器不工作。高分辨率修復:x1.5 潛在空間 + 去噪 0.6 或任何 gan + 去噪 0.3 - 0.55。
請注意,vpred 版本需要較低的 CFG 值。
示例可在倉庫中找到,更多示例請查看 civitai。
質量標籤
- 正標籤:
masterpiece, best quality
- 負標籤:
low quality, worst quality
除 low quality
外,負標籤中的其他標籤均可省略。像 lowres 這樣的元標籤已被移除,請勿使用。低分辨率圖像根據其重要性已被移除或使用 DAT 進行了上採樣和清理。
負提示
worst quality, low quality, watermark
為獲得最佳效果,請儘量保持負提示簡潔。濫用流行序列不會改善結果,因為所有相關缺陷已得到解決,但可能會導致不必要的效果、偏差和質量下降。
藝術家風格
該模型瞭解超過 35000 種藝術家風格。列表,在 Mega 上查看示例網格。使用時需加上 by
,否則可能無法正常工作。
通用風格
2.5d, anime screencap, bold line, sketch, cgi, digital painting, flat colors, smooth shading, minimalistic, ink style, oil style, pastel style
自然文本
該模型可以結合 booru 標籤和自然文本提示使用,將標籤和一些自然文本短語結合使用可獲得最佳效果。約 400 萬張數據集中的圖片帶有由 Claude、GPT、Gemini 和 ToriiGate 生成的混合自然文本描述。
0.8 版本對自然文本提示有更高級的理解,在 SDXL 動漫模型中表現出色。但這並不意味著你必須使用自然語言提示,僅使用標籤也是完全可以的,因為模型對標籤組合的理解也有所提高。
亮度/顏色/對比度
你可以使用額外的元標籤來控制亮度、顏色和對比度:
low brightness, high brightness, low saturation, high saturation, low gamma, high gamma, sharp colors, soft colors, hdr, sdr
Vpred 版本
RouWei-0.8 的 Vpred 版本即將推出。
基礎模型和浮點版本
你可以使用 FP32 版本 進行更精確的合併,或者在 Comfy 中以 fp32 模式使用文本編碼器以獲得一些優勢。
Epsilon 和 vpred 版本在主要訓練後進行了簡要的美學優化,以改善細節和連貫性。如果你想在合併、提取或微調 RouWei 時不考慮這些後期優化,可以使用 RouWei 的基礎版本:FP16 FP32
其他信息
Discord 服務器
加入
安全性
該模型可能會根據相應提示生成 NSFW 圖像,請考慮添加額外的過濾機制。輸出結果可能不準確或具有挑釁性,請勿將其作為參考。
許可證
與 illustrious 相同,請查看原始頁面瞭解限制。你可以自由地在合併、微調等操作中使用該模型,但請保留鏈接。
致謝
感謝許多匿名人士、Bakariso、dga、Fi.、ello、K.、LOL2024、NeuroSenko、rred、Soviet Cat、Sv1.、T.、TekeshiX 等提供幫助的夥伴。
捐贈
- BTC:bc1qwv83ggq8rvv07uk6dv4njs0j3yygj3aax4wg6c
- ETH/USDT(e):0x04C8a749F49aE8a56CB84cF0C99CD9E92eDB17db
- XMR:47F7JAyKP8tMBtzwxpoZsUVB8wzg2VrbtDKBice9FAS1FikbHEXXPof4PAb42CQ5ch8p8Hs4RvJuzPHDtaVSdQzD6ZbA5TZ
信息表格
屬性 |
詳情 |
模型類型 |
文本到圖像 |
基礎模型 |
Minthy/RouWei-0.7 |
庫名稱 |
diffusers |
標籤 |
anime |
重要提示
⚠️ 重要提示
當提示藝術家風格,尤其是混合多種風格時,它們的標籤必須放在單獨的 CLIP 塊中,否則結果可能會顯著下降。
💡 使用建議
結合標籤和自然文本短語使用該模型可獲得最佳效果;使用額外的元標籤可控制圖像的亮度、顏色和對比度。