M

Mobilevitv2 1.0 Voc Deeplabv3

由 apple 开发
基于MobileViTv2架构和DeepLabV3头部的语义分割模型,在PASCAL VOC数据集上以512x512分辨率预训练
下载量 29
发布时间 : 6/6/2023

模型简介

该模型结合了MobileViTv2的高效视觉Transformer架构和DeepLabV3的语义分割能力,适用于图像分割任务

模型特点

高效视觉Transformer
采用可分离自注意力机制替代传统多头自注意力,提升移动设备上的计算效率
DeepLabV3头部
结合DeepLabV3分割头部,增强模型对多尺度特征的捕捉能力
轻量化设计
专为移动和边缘设备优化,平衡性能和计算资源需求

模型能力

图像分割
语义分割
像素级分类

使用案例

计算机视觉
场景理解
识别和分割图像中的不同物体和区域
在PASCAL VOC数据集上表现良好
自动驾驶
道路场景分割,识别车辆、行人、道路等元素
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase