C

Coreml Stable Diffusion 2 1 Base

由pcuenq開發
基於潛在擴散模型的文本生成圖像系統,支持高分辨率圖像合成與編輯
下載量 164
發布時間 : 12/23/2022

模型概述

該模型可根據文本提示生成和修改圖像,使用OpenCLIP-ViT/H作為文本編碼器,在LAION-5B數據集子集上訓練

模型特點

蘋果硬件優化
提供Core ML格式權重,專為蘋果硅芯片優化,支持Swift/Python推理
安全過濾
訓練數據經過NSFW過濾器處理(p_unsafe=0.1閾值),並採用兩階段微調策略
高分辨率生成
支持768x768分辨率圖像生成,基於v-目標函數優化

模型能力

文本生成圖像
圖像編輯
藝術創作
風格遷移

使用案例

藝術創作
概念設計
根據文字描述生成藝術概念圖
快速可視化創意構思
數字藝術
生成各種風格的數字藝術作品
支持多種藝術風格輸出
教育研究
生成模型研究
探究擴散模型的侷限性與偏見
可用於學術論文實驗
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase