doohickey - mega - v1.01開源圖像合成模型 - 免費支持768x768高分辨率圖像生成

首頁

Doohickey Mega V1.01

由doohickey開發

專為高分辨率圖像合成優化的穩定擴散模型，基於Stable Diffusion v1.5微調，支持768x768分辨率圖像生成

圖像生成 #高分辨率圖像合成 #768x768優化 #CLIP-ViT-L-14增強

下載量 37

發布時間 : 11/14/2022

模型概述

該模型是基於runwayml/stable-diffusion-v1-5微調的高分辨率圖像生成模型，採用改進的CLIP文本編碼器，適合創意圖像生成任務

模型特點

高分辨率優化

專門針對768x768分辨率進行微調，適合生成高質量圖像

改進的CLIP編碼器

使用laion/CLIP-ViT-L-14-laion2B-s32B-b82K替代原版OpenAI CLIP模型

輕量級微調

僅訓練6000步，保持模型穩定性同時優化性能

模型能力

文本生成圖像

高分辨率圖像合成

創意內容生成

使用案例

創意設計

概念藝術創作

根據文本描述生成高質量概念藝術作品

768x768分辨率的概念藝術圖像

數字插畫生成

基於文本提示自動生成數字插畫

高保真度的插畫作品

內容創作

社交媒體內容生成

快速生成社交媒體所需的視覺內容

適合社交平臺分享的高質量圖像

屬性	詳情
模型類型	適用於高分辨率圖像合成的 Stable Diffusion 微調版本
基礎模型	runwayml/stable - diffusion - v1 - 5
替代 CLIP 模型	laion/CLIP - ViT - L - 14 - laion2B - s32B - b82K
微調步數	6000 步

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Doohickey Mega V1.01

模型概述

模型特點

模型能力

使用案例

🚀 高分辨率圖像合成模型

📚 詳細文檔

模型信息

許可證信息