L

Levit 192

由facebook開發
LeViT-192是一種結合了卷積神經網絡和Transformer架構的視覺模型,專注於圖像分類任務。
下載量 23
發布時間 : 6/1/2022

模型概述

LeViT-192模型在ImageNet-1k數據集上以224x224分辨率進行預訓練,結合了卷積神經網絡的高效性和Transformer的強大特徵提取能力。

模型特點

高效推理
結合卷積神經網絡和Transformer架構,實現更快的推理速度。
高精度分類
在ImageNet-1k數據集上預訓練,能夠準確分類1,000個類別。
教師-學生架構
採用教師-學生架構進行訓練,提升模型性能。

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
物體識別
識別圖像中的物體類別,如動物、日常用品等。
能夠準確分類ImageNet-1k中的1,000個類別。
場景分類
對圖像中的場景進行分類,如室內、室外、自然景觀等。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase