M

Mask2former Swin Large Coco Panoptic

由facebook開發
基於Swin骨幹網絡的Mask2Former大型版本,專為COCO數據集全景分割任務訓練的統一圖像分割模型
下載量 37.67k
發布時間 : 1/2/2023

模型概述

Mask2Former是一個統一的圖像分割框架,通過預測一組掩碼及其對應標籤來處理實例分割、語義分割和全景分割任務。相比前代模型MaskFormer,它在性能和效率上均有顯著提升。

模型特點

統一分割框架
將實例分割、語義分割和全景分割統一視為掩碼預測問題,簡化了任務處理流程
多尺度可變形注意力
採用先進的多尺度可變形注意力Transformer替代傳統像素解碼器,提升特徵提取能力
掩碼注意力機制
在Transformer解碼器中引入掩碼注意力,在不增加計算量的前提下顯著提升性能
高效訓練策略
通過採樣點計算損失而非整張掩碼,大幅提升訓練效率

模型能力

圖像分割
實例識別
語義理解
全景場景解析

使用案例

計算機視覺
自動駕駛場景理解
用於識別道路場景中的各種物體及其精確邊界
可準確分割車輛、行人、道路標誌等元素
醫學圖像分析
輔助醫療影像中的器官或病變區域分割
提供精確的器官邊界劃分
遙感圖像解析
分析衛星或航拍圖像中的地物分佈
可識別建築物、植被、水域等地理要素
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase