M

Mask2former Swin Base Coco Panoptic

由facebook開發
基於Swin骨幹網絡的Mask2Former模型,在COCO全景分割數據集上訓練,採用統一範式處理實例分割、語義分割和全景分割任務。
下載量 45.01k
發布時間 : 1/2/2023

模型概述

Mask2Former是一種通用圖像分割模型,通過預測一組掩碼及其對應標籤,將實例分割、語義分割和全景分割任務統一處理。相比前代模型在性能和效率上均有突破。

模型特點

統一分割範式
將實例分割、語義分割和全景分割統一視為掩碼預測問題,簡化了任務處理流程。
多尺度可變形注意力
升級像素解碼器採用多尺度可變形注意力機制,提升特徵提取能力。
掩碼注意力解碼器
採用帶掩碼注意力的變換器解碼器,以零計算成本提升模型性能。
高效訓練策略
通過子採樣點計算損失而非全掩碼,顯著提升訓練效率。

模型能力

圖像分割
實例分割
語義分割
全景分割

使用案例

計算機視覺
場景理解
對複雜場景中的物體進行精確分割和分類
可同時識別物體實例和語義類別
自動駕駛
道路場景解析,識別車輛、行人、道路等元素
提供精確的物體邊界和類別信息
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase