K

Kandinsky 2 1 Inpaint

由kandinsky-community開發
康定斯基2.1是基於Dall-E 2和潛在擴散模型最佳實踐的文本生成圖像模型,採用CLIP作為文本與圖像編碼器,提升了視覺表現力。
下載量 2,268
發布時間 : 5/24/2023

模型概述

該模型結合了CLIP多模態潛在空間的擴散圖像先驗技術,支持文本引導的圖像生成與修復,適用於創意圖像合成任務。

模型特點

多模態潛在空間映射
通過CLIP建立文本與圖像編碼的潛在空間映射,增強視覺表現力
圖像融合能力
支持文本引導的圖像操控和內容融合
高分辨率訓練
基於≥768x768分辨率的1.7億高質量圖像對訓練

模型能力

文本生成圖像
圖像修復
文本引導的圖像編輯
圖像插值

使用案例

創意設計
概念藝術生成
根據文字描述生成創意概念圖
示例展示了為貓添加帽子的圖像修復效果
內容編輯
圖像元素替換
通過遮罩和文本提示修改圖像局部內容
可精確控制修改區域並保持背景連貫
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase