D

Deeplabv3 Mobilevit X Small

Developed by apple
輕量級視覺Transformer模型,結合MobileNetV2與Transformer模塊,適用於移動端語義分割任務。
Downloads 268
Release Time : 5/30/2022

Model Overview

該模型在PASCAL VOC數據集上預訓練,結合了MobileViT的輕量級架構和DeepLabV3的語義分割能力,適合資源受限環境下的圖像分割應用。

Model Features

輕量級設計
結合MobileNetV2的輕量級卷積層和Transformer的全局處理能力,適合移動端部署。
高效分割
採用DeepLabV3頭部結構,在保持輕量化的同時實現高質量的語義分割。
無需位置編碼
MobileViT模塊可直接嵌入CNN任意位置,無需額外位置編碼。

Model Capabilities

圖像語義分割
移動端圖像處理
即時分割任務

Use Cases

計算機視覺
場景理解
對圖像中的不同物體進行像素級分類,適用於自動駕駛、監控等場景。
在PASCAL VOC數據集上達到77.1 mIOU
移動端圖像處理
在資源受限的設備上實現即時語義分割。
僅需2.9M參數,適合移動端部署
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase