M

Mask2former Swin Large Coco Panoptic

Developed by facebook
基於Swin骨幹網絡的Mask2Former大型版本,專為COCO數據集全景分割任務訓練的統一圖像分割模型
Downloads 37.67k
Release Time : 1/2/2023

Model Overview

Mask2Former是一個統一的圖像分割框架,通過預測一組掩碼及其對應標籤來處理實例分割、語義分割和全景分割任務。相比前代模型MaskFormer,它在性能和效率上均有顯著提升。

Model Features

統一分割框架
將實例分割、語義分割和全景分割統一視為掩碼預測問題,簡化了任務處理流程
多尺度可變形注意力
採用先進的多尺度可變形注意力Transformer替代傳統像素解碼器,提升特徵提取能力
掩碼注意力機制
在Transformer解碼器中引入掩碼注意力,在不增加計算量的前提下顯著提升性能
高效訓練策略
通過採樣點計算損失而非整張掩碼,大幅提升訓練效率

Model Capabilities

圖像分割
實例識別
語義理解
全景場景解析

Use Cases

計算機視覺
自動駕駛場景理解
用於識別道路場景中的各種物體及其精確邊界
可準確分割車輛、行人、道路標誌等元素
醫學圖像分析
輔助醫療影像中的器官或病變區域分割
提供精確的器官邊界劃分
遙感圖像解析
分析衛星或航拍圖像中的地物分佈
可識別建築物、植被、水域等地理要素
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase