G

Gligen Inpainting Text Image

由anhnct開發
GLIGEN是一種基於擴散的接地文本到圖像生成模型,能夠根據文本提示、邊界框和參考圖像生成逼真圖像。
下載量 108
發布時間 : 8/23/2023

模型概述

該模型可以根據文本提示、邊界框和參考圖像生成圖像,支持在指定區域內插入新對象或風格,無需額外微調。

模型特點

開放集接地生成
支持根據文本提示和邊界框在指定區域內生成或插入對象,無需額外微調。
多模態輸入
支持文本、邊界框和參考圖像作為輸入,靈活控制生成內容。
高質量生成
基於擴散模型和CLIP ViT-L/14文本編碼器,生成逼真圖像。

模型能力

文本生成圖像
圖像編輯
對象插入

使用案例

藝術創作
藝術作品生成
根據文本提示生成藝術作品,用於設計或創意過程。
生成符合描述的藝術圖像
教育工具
教學輔助
生成教學用圖像,幫助學生理解抽象概念。
生成直觀的教學圖像
研究
生成模型研究
探索和理解生成模型的侷限性和偏見。
提供研究數據和案例
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase