D

Doohickey Mega

由doohickey開發
專為高分辨率圖像合成優化的穩定擴散模型系列,基於Stable Diffusion v1-5微調,支持多種分辨率比例
下載量 186
發布時間 : 11/12/2022

模型概述

基於runwayml/stable-diffusion-v1-5微調的文本到圖像生成模型,特別優化了768x768分辨率附近的圖像合成質量,支持多種比例輸出

模型特點

高分辨率優化
專門針對768x768分辨率附近進行微調,生成高質量圖像
多種比例支持
支持640x640至768x768多種輸出比例(如768x640/704x768)
手部細節優化
v3-6000及後續版本特別優化了手部細節表現
改進的CLIP模型
v3版本採用laion/CLIP-ViT-L-14-laion2B-s32B-b82K模型並同步微調

模型能力

文本到圖像生成
高分辨率圖像合成
多種比例圖像生成

使用案例

創意設計
概念藝術創作
根據文本描述生成高分辨率概念藝術圖像
768x768分辨率的高質量藝術作品
數字插畫生成
快速生成各種風格的插畫作品
支持多種比例的專業級插畫
商業應用
廣告素材生成
為營銷活動快速生成高質量視覺素材
可直接用於商業用途的高清圖像
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase