M

Mask2former Swin Large Ade Panoptic

由facebook開發
基於Swin大型骨幹網絡在ADE20k全景分割數據集上訓練的Mask2Former模型,採用統一範式處理實例分割、語義分割和全景分割任務。
下載量 2,625
發布時間 : 1/5/2023

模型概述

Mask2Former是一種通用的圖像分割模型,通過預測一組掩碼及對應標籤,將實例分割、語義分割和全景分割三大任務統一視為實例分割問題。

模型特點

統一分割範式
通過預測一組掩碼及對應標籤,將實例分割、語義分割和全景分割三大任務統一視為實例分割問題。
多尺度可變形注意力
採用多尺度可變形注意力Transformer升級像素解碼器,提升模型性能。
掩碼注意力機制
引入掩碼注意力機制的Transformer解碼器,提升性能而不增加計算量。
高效訓練
通過子採樣點計算損失顯著提升訓練效率。

模型能力

圖像分割
實例分割
語義分割
全景分割

使用案例

計算機視覺
場景理解
用於理解複雜場景中的物體及其關係
自動駕駛
用於道路場景的物體識別和分割
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase