M

Mask2former Swin Small Cityscapes Instance

由facebook開發
Mask2Former是基於Transformer的統一圖像分割模型,採用掩碼注意力機制提升性能
下載量 43
發布時間 : 1/5/2023

模型概述

該模型是Mask2Former的小型版本,使用Swin Transformer作為骨幹網絡,專門針對Cityscapes數據集進行實例分割任務微調。它採用統一架構處理實例分割、語義分割和全景分割任務。

模型特點

統一分割架構
採用統一範式處理實例分割、語義分割和全景分割任務
掩碼注意力機制
引入帶掩碼注意力的Transformer解碼器,提升性能而不增加計算量
高效訓練策略
通過採樣點計算損失而非整張掩碼,顯著提升訓練效率

模型能力

圖像實例分割
多尺度特徵提取
高精度物體邊界識別

使用案例

自動駕駛
街景物體識別
識別城市街景中的車輛、行人等實例
在Cityscapes數據集上表現優異
智能監控
場景分析
對監控畫面中的物體進行精確分割和識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase