google-vit-base-patch16-224-face开源图像分类模型

Google Vit Base Patch16 224 Face

由 jayanta 开发

基于google/vit-base-patch16-224在图像文件夹数据集上微调的视觉Transformer模型，用于图像分类任务。

下载量 18

发布时间 : 1/12/2023

模型简介

该模型是基于Vision Transformer (ViT)架构的图像分类模型，经过微调后适用于特定领域的图像识别任务。

基于ViT架构

采用Vision Transformer架构，利用自注意力机制处理图像数据

微调版本

在基础模型上进行微调，适应特定图像分类任务

中等规模模型

使用base规模的ViT模型，平衡性能和计算资源需求

图像分类

特征提取

视觉模式识别

计算机视觉

人脸图像分类

对包含人脸的图像进行分类识别

在评估集上达到72.49%的准确率

通用图像分类

对各类图像进行分类识别

属性	详情
模型类型	基于 google/vit-base-patch16-224 微调的图像分类模型
训练数据	imagefolder 数据集
评估指标	准确率、精确率、召回率、F1 值