L

Levit 256

由facebook開發
LeViT-256是基於Transformer架構的高效視覺模型,專為快速推理設計,在ImageNet-1k數據集上預訓練。
下載量 37
發布時間 : 6/1/2022

模型概述

LeViT是一種結合了卷積神經網絡和Transformer優勢的視覺模型,適用於圖像分類任務,具有高效的推理速度。

模型特點

高效推理
通過結合CNN和Transformer的優勢,實現比純Transformer模型更快的推理速度
混合架構
創新性地將卷積神經網絡與Transformer結合,兼具局部和全局特徵提取能力
教師-學生訓練
使用教師模型指導訓練過程,提高模型性能

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
物體識別
識別圖像中的物體類別
可準確分類ImageNet-1k中的1,000個類別
場景理解
分析圖像場景內容
可識別如宮殿等複雜場景
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase