D

Deeplabv3 Mobilevit X Small

由 apple 开发
轻量级视觉Transformer模型,结合MobileNetV2与Transformer模块,适用于移动端语义分割任务。
下载量 268
发布时间 : 5/30/2022

模型简介

该模型在PASCAL VOC数据集上预训练,结合了MobileViT的轻量级架构和DeepLabV3的语义分割能力,适合资源受限环境下的图像分割应用。

模型特点

轻量级设计
结合MobileNetV2的轻量级卷积层和Transformer的全局处理能力,适合移动端部署。
高效分割
采用DeepLabV3头部结构,在保持轻量化的同时实现高质量的语义分割。
无需位置编码
MobileViT模块可直接嵌入CNN任意位置,无需额外位置编码。

模型能力

图像语义分割
移动端图像处理
实时分割任务

使用案例

计算机视觉
场景理解
对图像中的不同物体进行像素级分类,适用于自动驾驶、监控等场景。
在PASCAL VOC数据集上达到77.1 mIOU
移动端图像处理
在资源受限的设备上实现实时语义分割。
仅需2.9M参数,适合移动端部署
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase