L

Levit 384

由facebook開發
LeViT-384是基於ImageNet-1k數據集預訓練的視覺Transformer模型,結合了卷積網絡的優勢以實現更快的推理速度。
下載量 37
發布時間 : 6/1/2022

模型概述

LeViT模型是一種結合了卷積網絡和Transformer架構的視覺模型,專門用於圖像分類任務。該模型在保持高準確率的同時優化了推理速度。

模型特點

高效推理
結合卷積網絡的優勢,優化了傳統視覺Transformer的推理速度
高準確率
在ImageNet-1k數據集上訓練,具備優秀的圖像分類能力
教師-學生架構
採用教師-學生訓練方式提升模型性能

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
物體識別
識別圖像中的物體並分類為1000個ImageNet類別
準確識別常見物體如動物、日常用品等
場景理解
分析圖像場景內容
可識別建築、自然景觀等場景類型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase