M

Mask2former Swin Tiny Coco Panoptic

由facebook開發
Mask2Former是基於Transformer的統一圖像分割模型,支持實例分割、語義分割和全景分割任務,採用掩碼注意力機制提升性能
下載量 4,538
發布時間 : 1/2/2023

模型概述

Mask2Former採用統一範式處理圖像分割任務,通過預測一組掩碼及對應標籤實現實例/語義/全景分割。相比前代模型,其創新在於多尺度可變形注意力機制和掩碼注意力解碼器

模型特點

統一分割架構
將實例/語義/全景分割統一為掩碼預測問題,簡化任務處理流程
掩碼注意力機制
採用帶掩碼的注意力Transformer解碼器,在不增加計算量的前提下提升性能
高效訓練策略
通過採樣點計算損失而非整張掩碼,顯著提升訓練效率

模型能力

圖像分割
實例分割
語義分割
全景分割

使用案例

計算機視覺
場景理解
對複雜場景中的物體進行像素級識別和分類
可輸出帶有語義標籤的分割掩碼
自動駕駛
識別道路場景中的各類物體和可行駛區域
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase