T

Test Mask2former Swin Large Cityscapes Semantic

由kroixy開發
基於Swin骨幹網絡的大尺寸Mask2Former模型,專為Cityscapes語義分割任務訓練,採用統一架構處理圖像分割任務
下載量 22
發布時間 : 2/11/2025

模型概述

Mask2Former是一種通用圖像分割模型,通過預測一組掩碼及對應標籤統一處理實例分割、語義分割和全景分割任務。相比前代模型在性能和效率上均有提升。

模型特點

統一分割架構
通過預測掩碼和標籤的統一範式處理實例分割、語義分割和全景分割三大任務
掩碼注意力機制
創新性採用掩碼注意力機制的Transformer解碼器,提升性能而不增加計算量
高效訓練策略
通過子採樣點計算損失而非整張掩碼,顯著提升訓練效率
多尺度特徵處理
採用多尺度可變形注意力Transformer替代傳統像素解碼器,增強特徵提取能力

模型能力

圖像語義分割
多類別物體識別
像素級標註

使用案例

自動駕駛
街景語義理解
對城市道路場景中的各類元素(如車輛、行人、道路等)進行像素級分割
可用於自動駕駛系統的環境感知模塊
地理信息系統
航拍圖像分析
對航拍或衛星圖像中的建築、植被、水域等進行分類識別
輔助城市規劃與土地資源管理
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase