D

Deeplabv3 Mobilevit X Small

由apple開發
輕量級視覺Transformer模型,結合MobileNetV2與Transformer模塊,適用於移動端語義分割任務。
下載量 268
發布時間 : 5/30/2022

模型概述

該模型在PASCAL VOC數據集上預訓練,結合了MobileViT的輕量級架構和DeepLabV3的語義分割能力,適合資源受限環境下的圖像分割應用。

模型特點

輕量級設計
結合MobileNetV2的輕量級卷積層和Transformer的全局處理能力,適合移動端部署。
高效分割
採用DeepLabV3頭部結構,在保持輕量化的同時實現高質量的語義分割。
無需位置編碼
MobileViT模塊可直接嵌入CNN任意位置,無需額外位置編碼。

模型能力

圖像語義分割
移動端圖像處理
即時分割任務

使用案例

計算機視覺
場景理解
對圖像中的不同物體進行像素級分類,適用於自動駕駛、監控等場景。
在PASCAL VOC數據集上達到77.1 mIOU
移動端圖像處理
在資源受限的設備上實現即時語義分割。
僅需2.9M參數,適合移動端部署
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase