O

Oneformer Ade20k Dinat Large

由shi-labs開發
首個多任務通用圖像分割框架,單一模型支持語義/實例/全景分割任務
下載量 2,275
發布時間 : 11/15/2022

模型概述

OneFormer 是基於 Transformer 的通用圖像分割模型,通過單一架構和訓練流程實現語義分割、實例分割和全景分割三項任務,在 ADE20k 數據集上訓練。

模型特點

多任務統一架構
單一模型同時支持語義分割、實例分割和全景分割三項任務
動態任務適應
通過任務令牌機制實現訓練時的任務引導和推理時的任務動態切換
超越專用模型
在多項分割任務上性能超過專門設計的單任務模型

模型能力

語義分割
實例分割
全景分割
場景解析
物體識別

使用案例

計算機視覺
場景理解
對室內外場景進行像素級語義解析
可識別150類場景元素(基於ADE20k數據集)
物體實例分割
識別並分割圖像中的獨立物體實例
可處理複雜場景中的重疊物體
自動駕駛
道路場景解析
即時分割道路、車輛、行人等元素
適用於自動駕駛系統的環境感知模塊
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase