D

Deeplabv3 Mobilevit Small

由apple開發
輕量級視覺Transformer模型,結合MobileNetV2與Transformer模塊,適用於移動端語義分割任務
下載量 817
發布時間 : 5/30/2022

模型概述

該模型在MobileViT主幹網絡上添加DeepLabV3頭部,專為語義分割任務設計,在PASCAL VOC數據集上預訓練

模型特點

輕量級設計
結合MobileNetV2的輕量特性與Transformer的全局處理能力,適合移動端部署
高效分割
採用DeepLabV3頭部結構,在保持輕量化的同時實現精確的語義分割
多尺度訓練
預訓練階段採用160x160到320x320的多尺度採樣策略增強模型適應性

模型能力

圖像語義分割
移動端圖像處理
即時場景理解

使用案例

計算機視覺
自動駕駛場景理解
識別道路場景中的不同物體類別
在PASCAL VOC上達到79.1 mIOU
移動端圖像編輯
實現手機端即時背景替換/物體分割功能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase