M

Mask2former Swin Small Cityscapes Instance

Developed by facebook
Mask2Former是基于Transformer的统一图像分割模型,采用掩码注意力机制提升性能
Downloads 43
Release Time : 1/5/2023

Model Overview

该模型是Mask2Former的小型版本,使用Swin Transformer作为骨干网络,专门针对Cityscapes数据集进行实例分割任务微调。它采用统一架构处理实例分割、语义分割和全景分割任务。

Model Features

统一分割架构
采用统一范式处理实例分割、语义分割和全景分割任务
掩码注意力机制
引入带掩码注意力的Transformer解码器,提升性能而不增加计算量
高效训练策略
通过采样点计算损失而非整张掩码,显著提升训练效率

Model Capabilities

图像实例分割
多尺度特征提取
高精度物体边界识别

Use Cases

自动驾驶
街景物体识别
识别城市街景中的车辆、行人等实例
在Cityscapes数据集上表现优异
智能监控
场景分析
对监控画面中的物体进行精确分割和识别
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase