M

Mask2former Swin Tiny Ade Semantic

由facebook開發
Mask2Former 是一種基於 Transformer 的統一圖像分割模型,能夠處理實例分割、語義分割和全景分割任務。
下載量 7,834
發布時間 : 1/5/2023

模型概述

Mask2Former 採用統一範式解決多種圖像分割任務,通過預測一組掩碼及其對應標籤來實現。相比前代模型 MaskFormer,它在性能和效率上均有提升。

模型特點

統一分割範式
將實例分割、語義分割和全景分割統一為實例分割處理方式
高效注意力機制
採用多尺度可變形注意力 Transformer 替換傳統像素解碼器
掩碼注意力解碼器
使用帶掩碼注意力的 Transformer 解碼器提升性能而不增加計算量
高效訓練方法
通過基於採樣點而非完整掩碼計算損失來提升訓練效率

模型能力

語義分割
實例分割
全景分割
圖像分析

使用案例

計算機視覺
場景理解
對複雜場景中的物體進行識別和分割
可準確識別和分割 ADE20k 數據集中的 150 個語義類別
自動駕駛
道路場景中的物體檢測和分割
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase