M

Mask2former Swin Large Mapillary Vistas Panoptic

由 facebook 开发
基于Swin骨干网络的Mask2Former大尺寸版本,专为全景分割任务设计,在Mapillary Vistas数据集上训练
下载量 2,750
发布时间 : 1/5/2023

模型简介

Mask2Former是一个统一的图像分割框架,通过预测一组掩码及对应标签来处理实例分割、语义分割和全景分割任务。相比前代模型MaskFormer,在性能和效率上均有显著提升。

模型特点

统一分割框架
将实例分割、语义分割和全景分割统一为实例分割任务处理
多尺度可变形注意力
采用多尺度可变形注意力Transformer升级像素解码器,提升性能
掩码注意力机制
引入掩码注意力机制的Transformer解码器,以零计算增量提升性能
高效训练
通过子采样点计算损失值显著提升训练效率

模型能力

图像分割
全景分割
实例分割
语义分割

使用案例

计算机视觉
街景理解
用于Mapillary Vistas等街景数据集的全景分割
可准确识别和分割街景中的各类物体
物体识别与分割
识别图像中的物体并生成精确的掩码
如示例中的猫咪和城堡识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase