M

Mask2former Swin Large Cityscapes Semantic

由facebook開發
基於Swin骨幹網絡的大尺寸Mask2Former模型,專為Cityscapes語義分割任務訓練,採用統一架構處理多種圖像分割任務。
下載量 296.33k
發布時間 : 1/5/2023

模型概述

Mask2Former是一種先進的圖像分割模型,能夠統一處理實例分割、語義分割和全景分割任務。該特定版本針對城市街景語義分割進行了優化。

模型特點

統一分割架構
通過預測一組掩碼及其對應標籤,統一處理實例分割、語義分割和全景分割任務。
改進的注意力機制
採用多尺度可變形注意力Transformer和掩碼注意力機制,提升性能而不增加計算量。
高效訓練策略
通過在下采樣點上計算損失而非整張掩碼,顯著提升訓練效率。

模型能力

圖像語義分割
街景圖像分析
多類別物體識別

使用案例

智能交通系統
城市街景解析
自動識別和分割道路、車輛、行人等城市街景元素
可用於交通流量分析、自動駕駛環境感知等應用
地理信息系統
衛星圖像分析
對衛星或航拍圖像進行語義分割
可用於城市規劃、土地利用分類等場景
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase