M

Mask2former Swin Small Coco Panoptic

由facebook開發
基於Swin骨幹網絡的Mask2Former小規模版本,專為COCO數據集全景分割任務優化
下載量 240
發布時間 : 1/2/2023

模型概述

Mask2Former是一種通用圖像分割模型,採用統一框架處理實例分割、語義分割和全景分割任務,通過預測一組掩碼及對應標籤實現。相比前代模型MaskFormer,在性能和效率上均有顯著提升。

模型特點

統一分割框架
將實例分割、語義分割和全景分割統一為實例分割任務處理
高效注意力機制
採用多尺度可變形注意力Transformer替代傳統像素解碼器
掩碼注意力解碼器
引入帶掩碼注意力的Transformer解碼器,在不增加計算量的前提下提升性能
高效訓練策略
通過採樣點計算損失而非整張掩碼,顯著提升訓練效率

模型能力

圖像分割
全景分割
實例分割
語義分割

使用案例

計算機視覺
場景理解
對複雜場景中的物體進行像素級識別和分類
可生成包含語義標籤的分割掩碼
自動駕駛
道路場景中各類物體的精確分割
有助於自動駕駛系統理解周圍環境
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase