K

Karlo V1 Alpha Image Variations

由kakaobrain開發
Karlo 是基於 OpenAI unCLIP 架構的文本條件圖像生成模型,具備高效超分辨率能力
下載量 45
發布時間 : 1/30/2023

模型概述

Karlo 是一個基於 unCLIP 架構的文本到圖像生成模型,能夠通過文本描述生成高質量圖像,並支持圖像變體生成。其超分辨率模塊能快速將低分辨率圖像提升至 256 像素。

模型特點

高效超分辨率
僅需7步逆向步驟即可將64像素圖像升級至256像素,通過VQ-GAN風格損失微調恢復高頻細節
改進架構
將解碼器中可訓練變壓器替換為ViT-L/14文本編碼器,提升模型效率
大規模訓練
在1.15億圖文對(含COYO-100M、CC3M和CC12M)上從頭訓練

模型能力

文本生成圖像
圖像超分辨率提升
圖像變體生成

使用案例

創意設計
概念藝術生成
根據文本描述快速生成創意概念圖像
如示例中生成的'翠綠葉片上一隻紅色大青蛙的高清照片'
圖像增強
低分辨率圖像增強
將低質量圖像快速提升至256像素分辨率
通過超分辨率模塊實現高頻細節恢復
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase