L

Levit 192

Developed by facebook
LeViT-192是一種結合了卷積神經網絡和Transformer架構的視覺模型,專注於圖像分類任務。
Downloads 23
Release Time : 6/1/2022

Model Overview

LeViT-192模型在ImageNet-1k數據集上以224x224分辨率進行預訓練,結合了卷積神經網絡的高效性和Transformer的強大特徵提取能力。

Model Features

高效推理
結合卷積神經網絡和Transformer架構,實現更快的推理速度。
高精度分類
在ImageNet-1k數據集上預訓練,能夠準確分類1,000個類別。
教師-學生架構
採用教師-學生架構進行訓練,提升模型性能。

Model Capabilities

圖像分類
視覺特徵提取

Use Cases

計算機視覺
物體識別
識別圖像中的物體類別,如動物、日常用品等。
能夠準確分類ImageNet-1k中的1,000個類別。
場景分類
對圖像中的場景進行分類,如室內、室外、自然景觀等。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase