D

Deeplabv3 Mobilevit Small

Developed by apple
輕量級視覺Transformer模型,結合MobileNetV2與Transformer模塊,適用於移動端語義分割任務
Downloads 817
Release Time : 5/30/2022

Model Overview

該模型在MobileViT主幹網絡上添加DeepLabV3頭部,專為語義分割任務設計,在PASCAL VOC數據集上預訓練

Model Features

輕量級設計
結合MobileNetV2的輕量特性與Transformer的全局處理能力,適合移動端部署
高效分割
採用DeepLabV3頭部結構,在保持輕量化的同時實現精確的語義分割
多尺度訓練
預訓練階段採用160x160到320x320的多尺度採樣策略增強模型適應性

Model Capabilities

圖像語義分割
移動端圖像處理
即時場景理解

Use Cases

計算機視覺
自動駕駛場景理解
識別道路場景中的不同物體類別
在PASCAL VOC上達到79.1 mIOU
移動端圖像編輯
實現手機端即時背景替換/物體分割功能
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase