M

Mobilevit X Small

由apple開發
MobileViT是一種輕量級、低延遲的視覺Transformer模型,結合了CNN和Transformer的優勢,適用於移動端設備。
下載量 1,062
發布時間 : 5/30/2022

模型概述

該模型在ImageNet-1k數據集上預訓練,用於圖像分類任務,具有輕量化和高效的特點。

模型特點

輕量化設計
專為移動端設備優化,參數量僅2.3M,適合資源受限環境部署。
混合架構
結合MobileNetV2的CNN層和Transformer模塊,兼具局部和全局特徵處理能力。
多尺度訓練
訓練時採用多尺度採樣器(160x160至320x320),增強模型對不同分辨率圖像的適應能力。

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
物體識別
識別圖像中的物體類別(如動物、日常用品等)
在ImageNet-1k上達到74.8% top-1準確率
移動端視覺應用
適用於智能手機等移動設備的即時圖像分類場景
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase