M

Mobilevit Small

由Matthijs開發
MobileViT是一種輕量級、低延遲的視覺Transformer模型,結合了CNN和Transformer的優勢,適用於移動端設備。
下載量 39
發布時間 : 5/11/2022

模型概述

MobileViT是一種輕量級卷積神經網絡,結合了MobileNetV2風格的層與Transformer模塊,用於圖像分類任務。

模型特點

輕量級設計
專為移動端設備優化,具有低延遲和高效能的特點。
結合CNN和Transformer
融合了CNN的局部特徵提取能力和Transformer的全局處理能力。
無需位置編碼
模型設計無需傳統Transformer中的位置編碼。

模型能力

圖像分類
多尺度特徵提取

使用案例

計算機視覺
物體識別
識別圖像中的物體類別
在ImageNet-1k上達到78.4%的top-1準確率
場景分類
對圖像場景進行分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase