M

Mobilevitv2 1.0 Voc Deeplabv3

Developed by apple
基於MobileViTv2架構和DeepLabV3頭部的語義分割模型,在PASCAL VOC數據集上以512x512分辨率預訓練
Downloads 29
Release Time : 6/6/2023

Model Overview

該模型結合了MobileViTv2的高效視覺Transformer架構和DeepLabV3的語義分割能力,適用於圖像分割任務

Model Features

高效視覺Transformer
採用可分離自注意力機制替代傳統多頭自注意力,提升移動設備上的計算效率
DeepLabV3頭部
結合DeepLabV3分割頭部,增強模型對多尺度特徵的捕捉能力
輕量化設計
專為移動和邊緣設備優化,平衡性能和計算資源需求

Model Capabilities

圖像分割
語義分割
像素級分類

Use Cases

計算機視覺
場景理解
識別和分割圖像中的不同物體和區域
在PASCAL VOC數據集上表現良好
自動駕駛
道路場景分割,識別車輛、行人、道路等元素
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase