K

Karlo V1 Alpha Image Variations

Developed by kakaobrain
Karlo 是基于 OpenAI unCLIP 架构的文本条件图像生成模型,具备高效超分辨率能力
Downloads 45
Release Time : 1/30/2023

Model Overview

Karlo 是一个基于 unCLIP 架构的文本到图像生成模型,能够通过文本描述生成高质量图像,并支持图像变体生成。其超分辨率模块能快速将低分辨率图像提升至 256 像素。

Model Features

高效超分辨率
仅需7步逆向步骤即可将64像素图像升级至256像素,通过VQ-GAN风格损失微调恢复高频细节
改进架构
将解码器中可训练变压器替换为ViT-L/14文本编码器,提升模型效率
大规模训练
在1.15亿图文对(含COYO-100M、CC3M和CC12M)上从头训练

Model Capabilities

文本生成图像
图像超分辨率提升
图像变体生成

Use Cases

创意设计
概念艺术生成
根据文本描述快速生成创意概念图像
如示例中生成的'翠绿叶片上一只红色大青蛙的高清照片'
图像增强
低分辨率图像增强
将低质量图像快速提升至256像素分辨率
通过超分辨率模块实现高频细节恢复
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase