L

Levit 128

由facebook開發
LeViT-128是一個基於視覺Transformer架構的圖像分類模型,通過結合卷積網絡的優勢實現高效推理。
下載量 44
發布時間 : 6/1/2022

模型概述

LeViT-128模型在ImageNet-1k數據集上以224x224分辨率進行了預訓練,能夠將圖像分類為1,000個類別。

模型特點

高效推理
通過結合卷積網絡的優勢,實現比傳統視覺Transformer更快的推理速度
混合架構
創新性地將Transformer與卷積網絡結合,兼具兩者的優勢

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
物體識別
識別圖像中的物體類別
可準確分類ImageNet的1,000個類別
視覺內容分析
分析圖像內容並提取特徵
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase