Doohickey Mega
模型概述
基於runwayml/stable-diffusion-v1-5微調的文本到圖像生成模型,特別優化了768x768分辨率附近的圖像合成質量,支持多種比例輸出
模型特點
高分辨率優化
專門針對768x768分辨率附近進行微調,生成高質量圖像
多種比例支持
支持640x640至768x768多種輸出比例(如768x640/704x768)
手部細節優化
v3-6000及後續版本特別優化了手部細節表現
改進的CLIP模型
v3版本採用laion/CLIP-ViT-L-14-laion2B-s32B-b82K模型並同步微調
模型能力
文本到圖像生成
高分辨率圖像合成
多種比例圖像生成
使用案例
創意設計
概念藝術創作
根據文本描述生成高分辨率概念藝術圖像
768x768分辨率的高質量藝術作品
數字插畫生成
快速生成各種風格的插畫作品
支持多種比例的專業級插畫
商業應用
廣告素材生成
為營銷活動快速生成高質量視覺素材
可直接用於商業用途的高清圖像
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98