M

Mobilevit Small

由apple開發
MobileViT是一種輕量級、低延遲的視覺Transformer模型,結合了CNN和Transformer的優勢,適用於移動端設備。
下載量 894.23k
發布時間 : 5/30/2022

模型概述

MobileViT是一種輕量級的卷積神經網絡,結合了MobileNetV2風格的層與Transformer模塊,用於圖像分類任務。

模型特點

輕量級設計
模型參數量僅為5.6M,適合移動端部署。
結合CNN和Transformer
融合了CNN的局部特徵提取能力和Transformer的全局建模能力。
無需位置編碼
模型設計不需要位置編碼,簡化了實現。

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
ImageNet圖像分類
將圖像分類為1000個ImageNet類別之一。
Top-1準確率78.4%,Top-5準確率94.1%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase