M

Mask2former Swin Tiny Coco Instance

由facebook開發
基於COCO數據集訓練的Mask2Former微型版實例分割模型,採用Swin骨幹網絡,統一處理分割任務
下載量 149.85k
發布時間 : 12/23/2022

模型概述

Mask2Former是一種通用的圖像分割模型,通過預測一組掩碼及對應標籤來處理實例分割、語義分割和全景分割任務。相比前代模型,在性能和效率上均有提升。

模型特點

統一分割範式
將實例分割、語義分割和全景分割統一為實例分割任務處理
高效注意力機制
採用多尺度可變形注意力Transformer替代傳統像素解碼器
掩碼注意力解碼器
引入帶掩碼注意力的Transformer解碼器提升性能而不增加計算量
高效訓練方法
通過採樣點計算損失而非整張掩碼,顯著提升訓練效率

模型能力

圖像分割
實例識別
對象掩碼生成

使用案例

計算機視覺
對象識別與分割
識別圖像中的對象並生成精確的像素級分割掩碼
在COCO數據集上實現高精度實例分割
場景理解
分析複雜場景中的多個對象及其空間關係
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase