V

Vit Base 224 In21k Ft Cifar10

Developed by edumunozsala
基于Vision Transformer架构的西班牙语图像分类模型,在CIFAR-10数据集上微调,准确率达97%。
Downloads 16
Release Time : 6/11/2022

Model Overview

该模型使用亚马逊SageMaker和Hugging Face深度学习容器进行训练,基础模型是Vision Transformer(基础尺寸模型),在ImageNet-21k数据集上预训练,并在CIFAR-10数据集上微调,用于图像分类任务。

Model Features

高准确率
在CIFAR-10数据集上达到97%的准确率。
基于Vision Transformer
使用Transformer编码器架构,适用于图像分类任务。
微调模型
在ImageNet-21k上预训练,并在CIFAR-10数据集上微调。

Model Capabilities

图像分类
高精度识别

Use Cases

图像识别
CIFAR-10图像分类
用于对CIFAR-10数据集中的图像进行分类。
准确率97%
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase