V

Vit Base Patch16 224 In21k Finetuned Cifar10

Developed by aaraki
基于Google Vision Transformer (ViT)架构的预训练模型,在CIFAR-10数据集上进行了微调,用于图像分类任务。
Downloads 16.69k
Release Time : 3/30/2022

Model Overview

该模型是基于Google的ViT-base-patch16-224-in21k预训练模型,在CIFAR-10数据集上进行微调后的版本,专门用于10类图像分类任务。

Model Features

高准确率
在CIFAR-10测试集上达到了97.88%的准确率
基于Transformer架构
采用Vision Transformer架构,利用自注意力机制处理图像数据
迁移学习
基于ImageNet-21k预训练模型进行微调,充分利用预训练知识

Model Capabilities

图像分类
10类物体识别

Use Cases

计算机视觉
CIFAR-10图像分类
对CIFAR-10数据集中的10类常见物体进行分类
准确率97.88%
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase