M

Mobilevitv2 1.0 Voc Deeplabv3

由apple開發
基於MobileViTv2架構和DeepLabV3頭部的語義分割模型,在PASCAL VOC數據集上以512x512分辨率預訓練
下載量 29
發布時間 : 6/6/2023

模型概述

該模型結合了MobileViTv2的高效視覺Transformer架構和DeepLabV3的語義分割能力,適用於圖像分割任務

模型特點

高效視覺Transformer
採用可分離自注意力機制替代傳統多頭自注意力,提升移動設備上的計算效率
DeepLabV3頭部
結合DeepLabV3分割頭部,增強模型對多尺度特徵的捕捉能力
輕量化設計
專為移動和邊緣設備優化,平衡性能和計算資源需求

模型能力

圖像分割
語義分割
像素級分類

使用案例

計算機視覺
場景理解
識別和分割圖像中的不同物體和區域
在PASCAL VOC數據集上表現良好
自動駕駛
道路場景分割,識別車輛、行人、道路等元素
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase