M

Mask2former Swin Base IN21k Cityscapes Panoptic

由facebook開發
Mask2Former是基於Transformer架構的通用圖像分割模型,能夠處理實例分割、語義分割和全景分割任務。
下載量 140
發布時間 : 1/5/2023

模型概述

該模型採用Swin Transformer作為骨幹網絡,在Cityscapes數據集上針對全景分割任務進行了微調。它通過預測一組掩碼及其對應標籤來實現分割任務。

模型特點

統一分割範式
將實例分割、語義分割和全景分割統一為實例分割任務處理
高效注意力機制
採用多尺度可變形注意力Transformer和掩碼注意力機制提升性能
訓練優化
通過子採樣點計算損失而非整個掩碼,顯著提高訓練效率

模型能力

圖像分割
全景分割
實例分割
語義分割

使用案例

自動駕駛
街景場景理解
用於自動駕駛系統中對城市街景的全面理解
可準確識別道路、車輛、行人等元素及其相互關係
城市測繪
城市元素分割
用於城市地圖繪製和更新
可自動識別建築物、道路、綠地等城市元素
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase