M

Mask2former Swin Base IN21k Ade Semantic

由facebook開發
Mask2Former是一種通用的圖像分割模型,能夠處理實例分割、語義分割和全景分割任務,通過預測一組掩碼及其對應標籤來實現。
下載量 879
發布時間 : 1/5/2023

模型概述

該模型採用Swin骨幹網絡,在ADE20k數據集上進行了語義分割任務的微調,通過改進的Transformer架構提供高效準確的分割能力。

模型特點

統一分割架構
通過單一模型架構處理實例分割、語義分割和全景分割三種任務
改進的Transformer設計
採用多尺度可變形注意力Transformer和帶掩碼注意力的Transformer解碼器,提升性能和效率
高效訓練方法
通過採樣點計算損失而非整張掩碼,顯著提升訓練效率

模型能力

圖像語義分割
圖像實例分割
圖像全景分割
多尺度圖像分析

使用案例

計算機視覺
場景理解
對複雜場景中的不同對象進行識別和分割
準確識別和分割場景中的各類物體
自動駕駛
道路場景分析,識別車輛、行人、道路標誌等
為自動駕駛系統提供精確的環境感知
醫學影像
醫學圖像分析
分割醫學圖像中的器官或病變區域
輔助醫生進行診斷和治療規劃
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase