M

Mask2former Swin Large Cityscapes Panoptic

由facebook開發
基於Swin骨幹網絡的Mask2Former模型,專門針對Cityscapes數據集的全景分割任務進行優化訓練
下載量 772
發布時間 : 1/3/2023

模型概述

Mask2Former是一種通用的圖像分割模型,採用統一框架處理實例分割、語義分割和全景分割任務。通過預測一組掩碼及其對應標籤,將三大任務統一視為實例分割問題。

模型特點

統一分割框架
將實例分割、語義分割和全景分割統一為實例分割問題處理
高效注意力機制
採用多尺度可變形注意力Transformer升級像素解碼器,提高計算效率
掩碼注意力解碼器
引入掩碼注意力機制的Transformer解碼器,提升性能而不增加計算量
高效訓練策略
通過子採樣點計算損失值顯著提升訓練效率

模型能力

圖像分割
全景分割
實例分割
語義分割

使用案例

自動駕駛
街景理解
識別和分割城市街景中的各類物體和區域
可用於自動駕駛系統的環境感知模塊
智能監控
場景分析
對監控視頻中的物體進行精確分割和識別
提升監控系統的智能分析能力
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase