M

Mask2former Swin Small Cityscapes Semantic

由facebook開發
基於Swin骨幹網絡的Mask2Former小型版本,專為Cityscapes語義分割任務訓練
下載量 952
發布時間 : 1/5/2023

模型概述

Mask2Former是一種通用的圖像分割模型,採用統一範式處理實例分割、語義分割和全景分割任務。通過預測一組掩碼及其對應標籤來實現分割功能。

模型特點

統一分割範式
將實例分割、語義分割和全景分割統一為實例分割任務處理
高效注意力機制
採用多尺度可變形注意力Transformer替代傳統像素解碼器
掩碼注意力解碼器
引入帶掩碼注意力的Transformer解碼器,提升性能而不增加計算量
高效訓練方式
通過採樣點計算損失而非整張掩碼,顯著提升訓練效率

模型能力

圖像語義分割
多類別物體識別
高精度掩碼預測

使用案例

自動駕駛
街景語義分割
對城市道路場景進行像素級分類,識別道路、車輛、行人等元素
在Cityscapes數據集上表現優異
遙感圖像分析
地表覆蓋分類
對衛星或航拍圖像進行地表覆蓋類型分割
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase