vit-base-patch16-224-in21k-wwwwii开源图像分类模型

Vit Base Patch16 224 In21k Wwwwii

由 Zynovia 开发

该模型是基于Google的ViT模型在未知数据集上微调的版本，主要用于图像分类任务。

下载量 22

发布时间 : 9/3/2022

模型简介

这是一个基于Vision Transformer (ViT)架构的图像分类模型，在google/vit-base-patch16-224-in21k基础上进行了微调。

基于ViT架构

使用Vision Transformer架构，适合处理图像数据

微调版本

在Google预训练模型基础上进行了微调

中等规模

基于ViT-base架构，参数规模适中

图像分类

特征提取

计算机视觉

通用图像分类

可用于对常见物体和场景进行分类

验证准确率58.45%，Top-3准确率78.45%

训练损失	训练准确率	训练前3准确率	验证损失	验证准确率	验证前3准确率	轮数
3.4972	0.1475	0.3067	3.0825	0.3240	0.5178	0
2.7352	0.4129	0.6613	2.4838	0.4543	0.6930	1
2.0429	0.6153	0.8315	1.9934	0.5690	0.7550	2
1.4246	0.7672	0.9166	1.6714	0.5876	0.8016	3
0.8976	0.8813	0.9721	1.6144	0.5845	0.7845	4