M

Mask2former Swin Large Mapillary Vistas Panoptic

由facebook開發
基於Swin骨幹網絡的Mask2Former大尺寸版本,專為全景分割任務設計,在Mapillary Vistas數據集上訓練
下載量 2,750
發布時間 : 1/5/2023

模型概述

Mask2Former是一個統一的圖像分割框架,通過預測一組掩碼及對應標籤來處理實例分割、語義分割和全景分割任務。相比前代模型MaskFormer,在性能和效率上均有顯著提升。

模型特點

統一分割框架
將實例分割、語義分割和全景分割統一為實例分割任務處理
多尺度可變形注意力
採用多尺度可變形注意力Transformer升級像素解碼器,提升性能
掩碼注意力機制
引入掩碼注意力機制的Transformer解碼器,以零計算增量提升性能
高效訓練
通過子採樣點計算損失值顯著提升訓練效率

模型能力

圖像分割
全景分割
實例分割
語義分割

使用案例

計算機視覺
街景理解
用於Mapillary Vistas等街景數據集的全景分割
可準確識別和分割街景中的各類物體
物體識別與分割
識別圖像中的物體並生成精確的掩碼
如示例中的貓咪和城堡識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase