M

Mask2former Swin Large Ade Semantic

由facebook開發
基於Swin骨幹網絡的大規模版本,在ADE20k語義分割數據集上訓練的Mask2Former模型,採用統一範式處理圖像分割任務。
下載量 238.92k
發布時間 : 1/5/2023

模型概述

Mask2Former是一種先進的圖像分割模型,能夠處理實例分割、語義分割和全景分割任務。通過預測一組掩碼及其對應標籤,統一了不同類型分割任務的處理方式。

模型特點

統一分割範式
將實例分割、語義分割和全景分割統一為實例分割任務處理
高效注意力機制
採用多尺度可變形注意力Transformer替代傳統像素解碼器
掩碼注意力解碼器
引入帶掩碼注意力的Transformer解碼器提升性能而不增加計算量
高效訓練方式
通過採樣點計算損失而非整張掩碼,顯著提升訓練效率

模型能力

圖像語義分割
實例分割
全景分割
多尺度特徵提取

使用案例

計算機視覺
場景理解
對複雜場景中的物體進行精確分割和分類
在ADE20k等標準數據集上達到SOTA性能
自動駕駛
道路場景中各類物體的識別與分割
醫學圖像分析
醫學影像中的器官或病變區域分割
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase