M

Mask2former Swin Tiny Cityscapes Instance

Developed by facebook
Mask2Former是基於Transformer架構的通用圖像分割模型,此版本專門針對Cityscapes數據集進行實例分割任務微調
Downloads 67
Release Time : 1/5/2023

Model Overview

該模型採用統一範式處理圖像分割任務,通過預測一組掩碼及對應標籤實現實例分割,相比前代模型在性能和效率上均有提升

Model Features

統一分割架構
採用統一範式處理實例分割、語義分割和全景分割任務,將三項任務均視為實例分割處理
高效注意力機制
使用多尺度可變形注意力Transformer替換傳統像素解碼器,提升計算效率
掩碼注意力解碼器
採用帶掩碼注意力的Transformer解碼器,在不增加計算量的前提下提升性能
高效訓練策略
通過在採樣點上計算損失而非整張掩碼,顯著提升訓練效率

Model Capabilities

圖像實例分割
多目標檢測與分割
場景理解

Use Cases

自動駕駛
道路場景分析
識別和分割道路上的車輛、行人、交通標誌等元素
可用於構建高精度環境感知系統
城市管理
城市基礎設施監測
自動識別和分割建築物、道路、綠化帶等城市元素
輔助城市規劃和管理決策
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase