M

Mask2former Swin Small Coco Instance

由facebook開發
Mask2Former是基於Transformer的統一圖像分割模型,在COCO數據集上微調用於實例分割任務
下載量 17.51k
發布時間 : 12/26/2022

模型概述

採用統一範式處理實例/語義/全景分割任務,通過預測掩碼組及對應標籤實現,相比前代MaskFormer在性能和效率上均有提升

模型特點

統一分割架構
將實例/語義/全景分割統一視為實例分割處理,簡化任務流程
多尺度可變形注意力
替代傳統像素解碼器,提升特徵提取效率
掩碼注意力機制
在不增加計算量的前提下提升模型性能
高效訓練策略
通過採樣點計算損失而非整張掩碼,顯著減少訓練資源消耗

模型能力

圖像實例分割
對象掩碼預測
多類別對象識別

使用案例

計算機視覺
物體識別與分割
識別圖像中的物體並生成精確分割掩碼
在COCO數據集上達到SOTA性能
場景理解
分析複雜場景中的對象分佈與空間關係
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase