M

Mask2former Swin Small Cityscapes Panoptic

由facebook開發
基於Swin骨幹網絡的小型Mask2Former模型,專為Cityscapes數據集的全景分割任務優化
下載量 568
發布時間 : 1/3/2023

模型概述

Mask2Former是一種通用圖像分割框架,通過預測一組掩碼及對應標籤統一處理實例分割、語義分割和全景分割任務。該特定檢查點針對城市街景全景分割進行了微調。

模型特點

統一分割框架
將實例分割、語義分割和全景分割統一為掩碼預測任務,簡化處理流程
高效注意力機制
採用多尺度可變形注意力Transformer替代傳統像素解碼器,提升計算效率
掩碼注意力解碼器
創新性引入帶掩碼注意力的Transformer解碼器,在不增加計算量的情況下提升性能
高效訓練策略
通過子採樣點計算損失而非整張掩碼,顯著減少訓練時的計算資源消耗

模型能力

圖像分割
街景理解
物體識別與定位
全景分割

使用案例

智能交通系統
街景要素分析
對城市道路中的車輛、行人、交通標誌等進行精確分割和分類
可用於交通流量監控和城市規劃
自動駕駛
環境感知
即時識別和分割道路場景中的各類物體
為自動駕駛系統提供精確的環境理解
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase