V

Vit Base Patch16 224 In21k Wr

Developed by Imene
该模型是基于google/vit-base-patch16-224-in21k在未知数据集上微调的视觉Transformer模型,主要用于图像分类任务。
Downloads 21
Release Time : 9/7/2022

Model Overview

这是一个基于Vision Transformer架构的图像分类模型,在未知数据集上进行了微调,适用于通用的图像识别任务。

Model Features

基于预训练模型微调
基于google/vit-base-patch16-224-in21k预训练模型进行微调,继承了强大的图像特征提取能力
混合精度训练
使用mixed_float16精度进行训练,兼顾训练速度和模型精度
优化器配置
采用AdamWeightDecay优化器配合PolynomialDecay学习率调度,有助于稳定训练过程

Model Capabilities

图像分类
特征提取

Use Cases

计算机视觉
通用图像分类
可用于对常见物体和场景进行分类识别
验证准确率57.7%,前三准确率80.35%
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase