U

Uniworld V1

由 LanguageBind 开发
UniWorld 是一个用于视觉理解、生成和编辑的统一框架,在20多个视觉任务中表现出色。
下载量 253
发布时间 : 5/21/2025

模型简介

UniWorld 是一个统一的视觉框架,支持视觉理解、生成和编辑任务。它采用高分辨率语义编码器,在多种视觉任务中表现优异,并且所有资源完全开源。

模型特点

完全开源
模型、数据、训练和评估代码全部开源,便于社区探索统一架构
高分辨率语义编码
使用对比视觉编码器作为参考控制信号,保留精细细节
多任务统一框架
支持20多种视觉任务,包括边缘检测、深度估计、图像分割等
高质量数据集
包含286K长描述样本和724K高质量编辑样本,图像短边≥1024像素

模型能力

文本到图像生成
图像编辑
图像理解
边缘检测
深度估计
草图绘制
线段检测
图像分割
产品提取
虚拟试穿

使用案例

图像生成
文本到图像生成
根据文本描述生成高质量图像
在GenEval、WISE等基准测试中表现优异
图像编辑
指令引导编辑
根据自然语言指令编辑图像
在ImgEdit-Bench上优于BAGEL和Step1X-Edit
风格迁移
将图像转换为特定艺术风格
支持多种风格转换
视觉理解
边缘检测
从图像中提取边缘信息
高精度边缘提取
深度估计
估计图像的深度信息
准确的深度图生成
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase