G

Google Vit Base Patch16 224 Face

由 jayanta 开发
基于google/vit-base-patch16-224在图像文件夹数据集上微调的视觉Transformer模型,用于图像分类任务。
下载量 18
发布时间 : 1/12/2023

模型简介

该模型是基于Vision Transformer (ViT)架构的图像分类模型,经过微调后适用于特定领域的图像识别任务。

模型特点

基于ViT架构
采用Vision Transformer架构,利用自注意力机制处理图像数据
微调版本
在基础模型上进行微调,适应特定图像分类任务
中等规模模型
使用base规模的ViT模型,平衡性能和计算资源需求

模型能力

图像分类
特征提取
视觉模式识别

使用案例

计算机视觉
人脸图像分类
对包含人脸的图像进行分类识别
在评估集上达到72.49%的准确率
通用图像分类
对各类图像进行分类识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase