google-vit-base-patch16-224-face開源圖像分類模型

Google Vit Base Patch16 224 Face

由jayanta開發

基於google/vit-base-patch16-224在圖像文件夾數據集上微調的視覺Transformer模型，用於圖像分類任務。

下載量 18

發布時間 : 1/12/2023

模型概述

該模型是基於Vision Transformer (ViT)架構的圖像分類模型，經過微調後適用於特定領域的圖像識別任務。

基於ViT架構

採用Vision Transformer架構，利用自注意力機制處理圖像數據

微調版本

在基礎模型上進行微調，適應特定圖像分類任務

中等規模模型

使用base規模的ViT模型，平衡性能和計算資源需求

圖像分類

特徵提取

視覺模式識別

計算機視覺

人臉圖像分類

對包含人臉的圖像進行分類識別

在評估集上達到72.49%的準確率

通用圖像分類

對各類圖像進行分類識別

屬性	詳情
模型類型	基於 google/vit-base-patch16-224 微調的圖像分類模型
訓練數據	imagefolder 數據集
評估指標	準確率、精確率、召回率、F1 值