K

Karlo V1 Alpha Image Variations

由 kakaobrain 开发
Karlo 是基于 OpenAI unCLIP 架构的文本条件图像生成模型,具备高效超分辨率能力
下载量 45
发布时间 : 1/30/2023

模型简介

Karlo 是一个基于 unCLIP 架构的文本到图像生成模型,能够通过文本描述生成高质量图像,并支持图像变体生成。其超分辨率模块能快速将低分辨率图像提升至 256 像素。

模型特点

高效超分辨率
仅需7步逆向步骤即可将64像素图像升级至256像素,通过VQ-GAN风格损失微调恢复高频细节
改进架构
将解码器中可训练变压器替换为ViT-L/14文本编码器,提升模型效率
大规模训练
在1.15亿图文对(含COYO-100M、CC3M和CC12M)上从头训练

模型能力

文本生成图像
图像超分辨率提升
图像变体生成

使用案例

创意设计
概念艺术生成
根据文本描述快速生成创意概念图像
如示例中生成的'翠绿叶片上一只红色大青蛙的高清照片'
图像增强
低分辨率图像增强
将低质量图像快速提升至256像素分辨率
通过超分辨率模块实现高频细节恢复
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase