D

Deeplabv3 Mobilevit Small

由 apple 开发
轻量级视觉Transformer模型,结合MobileNetV2与Transformer模块,适用于移动端语义分割任务
下载量 817
发布时间 : 5/30/2022

模型简介

该模型在MobileViT主干网络上添加DeepLabV3头部,专为语义分割任务设计,在PASCAL VOC数据集上预训练

模型特点

轻量级设计
结合MobileNetV2的轻量特性与Transformer的全局处理能力,适合移动端部署
高效分割
采用DeepLabV3头部结构,在保持轻量化的同时实现精确的语义分割
多尺度训练
预训练阶段采用160x160到320x320的多尺度采样策略增强模型适应性

模型能力

图像语义分割
移动端图像处理
实时场景理解

使用案例

计算机视觉
自动驾驶场景理解
识别道路场景中的不同物体类别
在PASCAL VOC上达到79.1 mIOU
移动端图像编辑
实现手机端实时背景替换/物体分割功能
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase