M

Mask2former Swin Tiny Cityscapes Instance

由facebook開發
Mask2Former是基於Transformer架構的通用圖像分割模型,此版本專門針對Cityscapes數據集進行實例分割任務微調
下載量 67
發布時間 : 1/5/2023

模型概述

該模型採用統一範式處理圖像分割任務,通過預測一組掩碼及對應標籤實現實例分割,相比前代模型在性能和效率上均有提升

模型特點

統一分割架構
採用統一範式處理實例分割、語義分割和全景分割任務,將三項任務均視為實例分割處理
高效注意力機制
使用多尺度可變形注意力Transformer替換傳統像素解碼器,提升計算效率
掩碼注意力解碼器
採用帶掩碼注意力的Transformer解碼器,在不增加計算量的前提下提升性能
高效訓練策略
通過在採樣點上計算損失而非整張掩碼,顯著提升訓練效率

模型能力

圖像實例分割
多目標檢測與分割
場景理解

使用案例

自動駕駛
道路場景分析
識別和分割道路上的車輛、行人、交通標誌等元素
可用於構建高精度環境感知系統
城市管理
城市基礎設施監測
自動識別和分割建築物、道路、綠化帶等城市元素
輔助城市規劃和管理決策
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase