M

Mask2former Swin Base Coco Instance

由facebook開發
基於Swin主幹網絡的Mask2Former模型,專為COCO實例分割任務設計,採用統一框架處理分割任務
下載量 3,249
發布時間 : 11/28/2022

模型概述

Mask2Former是一個先進的圖像分割模型,通過預測一組掩碼及對應標籤實現實例分割、語義分割和全景分割的統一處理。相比前代模型,在性能和效率上均有顯著提升。

模型特點

統一分割框架
將實例分割、語義分割和全景分割統一為實例分割任務處理
多尺度可變形注意力
採用多尺度可變形注意力Transformer替代傳統像素解碼器,提升性能
掩碼注意力機制
引入帶掩碼注意力的Transformer解碼器,在不增加計算量的情況下提升性能
高效訓練策略
通過採樣點計算損失而非整張掩碼,顯著提升訓練效率

模型能力

圖像分割
實例識別
目標檢測

使用案例

計算機視覺
物體實例分割
識別並分割圖像中的各個物體實例
可準確分割COCO數據集中的常見物體
場景理解
分析複雜場景中的多個物體及其關係
適用於自動駕駛、機器人視覺等場景
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase