V

Vit Base Patch16 224 In21k Finetuned Cifar10

由 nielsr 开发
这是一个基于 Google 的 ViT 基础模型,在 CIFAR10 数据集上进行微调后的视觉 Transformer 模型,用于图像分类任务。
下载量 31
发布时间 : 3/2/2022

模型简介

该模型是基于 Vision Transformer (ViT) 架构的图像分类模型,在 CIFAR10 数据集上微调后达到了 98.81% 的准确率。

模型特点

高准确率
在 CIFAR10 测试集上达到了 98.81% 的分类准确率
基于 Transformer 架构
使用 Vision Transformer (ViT) 架构,适合处理图像数据
预训练模型微调
基于 google/vit-base-patch16-224-in21k 预训练模型进行微调

模型能力

图像分类
视觉特征提取

使用案例

计算机视觉
CIFAR10 图像分类
对 CIFAR10 数据集中的图像进行分类
准确率达到 98.81%
通用图像分类
可用于其他类似规模的图像分类任务
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase