K

Kandinsky 2 2 Decoder Inpaint

由kandinsky-community開發
Kandinsky 2.2 是一個文本生成圖像的擴散模型,結合了Dall-E 2和潛在擴散模型的最佳實踐,並引入了新思路。
下載量 28.23k
發布時間 : 6/16/2023

模型概述

Kandinsky 2.2 採用CLIP模型作為文本和圖像編碼器,在CLIP模態的潛在空間之間建立擴散圖像先驗,提升了視覺表現力,支持圖像融合和文本引導的圖像處理。

模型特點

CLIP模態潛在空間映射
利用CLIP模型在文本和圖像編碼器之間建立擴散圖像先驗,增強視覺表現力
圖像融合能力
支持圖像融合和文本引導的圖像處理
局部修復生成
支持文本引導的局部圖像修復功能

模型能力

文本生成圖像
圖像局部修復
圖像融合

使用案例

創意設計
圖像局部編輯
在現有圖像上添加或修改特定元素,如在貓圖像上添加帽子
生成自然融合的新圖像
內容創作
文本到圖像生成
根據文本描述生成高質量圖像
生成符合描述的視覺內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase