M

Mask2former Swin Tiny Cityscapes Semantic

由facebook開發
Mask2Former 是一種統一的圖像分割框架,能夠處理實例分割、語義分割和全景分割任務。該模型基於Swin-Tiny骨幹網絡,並在Cityscapes數據集上進行了語義分割任務的微調。
下載量 55.98k
發布時間 : 1/5/2023

模型概述

Mask2Former 通過預測一組掩碼及其對應標籤,將實例分割、語義分割和全景分割三大任務統一視為實例分割問題。相比前代模型MaskFormer,Mask2Former在性能和效率上均有顯著提升。

模型特點

統一分割框架
將實例分割、語義分割和全景分割統一為單一框架處理
高效注意力機制
採用多尺度可變形注意力Transformer替代傳統像素解碼器
掩碼注意力機制
引入掩碼注意力機制的Transformer解碼器,提升性能而不增加計算量
高效訓練策略
通過採樣點計算損失而非整張掩碼,顯著提升訓練效率

模型能力

圖像分割
語義分割
實例分割
全景分割

使用案例

自動駕駛
街景語義分割
對城市街景圖像進行語義分割,識別道路、建築物、行人等元素
在Cityscapes數據集上表現優異
醫學影像
醫學圖像分析
可用於醫學圖像中的器官或病變區域分割
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase