U

Uniworld V1

由LanguageBind開發
UniWorld 是一個用於視覺理解、生成和編輯的統一框架,在20多個視覺任務中表現出色。
下載量 253
發布時間 : 5/21/2025

模型概述

UniWorld 是一個統一的視覺框架,支持視覺理解、生成和編輯任務。它採用高分辨率語義編碼器,在多種視覺任務中表現優異,並且所有資源完全開源。

模型特點

完全開源
模型、數據、訓練和評估代碼全部開源,便於社區探索統一架構
高分辨率語義編碼
使用對比視覺編碼器作為參考控制信號,保留精細細節
多任務統一框架
支持20多種視覺任務,包括邊緣檢測、深度估計、圖像分割等
高質量數據集
包含286K長描述樣本和724K高質量編輯樣本,圖像短邊≥1024像素

模型能力

文本到圖像生成
圖像編輯
圖像理解
邊緣檢測
深度估計
草圖繪製
線段檢測
圖像分割
產品提取
虛擬試穿

使用案例

圖像生成
文本到圖像生成
根據文本描述生成高質量圖像
在GenEval、WISE等基準測試中表現優異
圖像編輯
指令引導編輯
根據自然語言指令編輯圖像
在ImgEdit-Bench上優於BAGEL和Step1X-Edit
風格遷移
將圖像轉換為特定藝術風格
支持多種風格轉換
視覺理解
邊緣檢測
從圖像中提取邊緣信息
高精度邊緣提取
深度估計
估計圖像的深度信息
準確的深度圖生成
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase