LeViT-192 Open-Source Vision Model - Free Deployment to Boost Efficient Image Classification Tasks

Levit 192

Developed by facebook

LeViT-192 is a vision model that combines convolutional neural networks and Transformer architecture, focusing on image classification tasks.

Image Classification

Transformers

Open Source License:Apache-2.0 #Efficient Image Classification #Convolution-Enhanced Transformer #Low Computational Cost

Downloads 23

Release Time : 6/1/2022

Model Overview

The LeViT-192 model is pre-trained on the ImageNet-1k dataset at 224x224 resolution, combining the efficiency of convolutional neural networks with the powerful feature extraction capabilities of Transformers.

Model Features

Efficient Inference

Combines convolutional neural networks and Transformer architecture for faster inference speed.

High-Accuracy Classification

Pre-trained on the ImageNet-1k dataset, capable of accurately classifying 1,000 categories.

Teacher-Student Architecture

Utilizes a teacher-student architecture for training to enhance model performance.

Model Capabilities

Image Classification

Visual Feature Extraction

Use Cases

Computer Vision

Object Recognition

Identifies object categories in images, such as animals, everyday items, etc.

Can accurately classify 1,000 categories in ImageNet-1k.

Scene Classification

Classifies scenes in images, such as indoor, outdoor, natural landscapes, etc.

Property	Details
Model Type	LeViT-192 for image classification
Training Data	ImageNet-1k
Tags	vision, image-classification

Featured Recommended AI Models

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Levit 192

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 LeViT

🚀 Quick Start

💻 Usage Examples

Basic Usage

📄 License

Widget Examples