ViTForImageClassification開源圖像分類模型 - 基於CIFAR10微調準確率達96.78%

Vitforimageclassification

由Andron00e開發

該模型是基於google/vit-base-patch16-224-in21k在CIFAR10數據集上微調的圖像分類模型，準確率達96.78%。

下載量 43

發布時間 : 11/28/2023

模型概述

Vision Transformer (ViT) 圖像分類模型，適用於通用圖像分類任務。

高準確率

在CIFAR10數據集上達到96.78%的分類準確率

基於Transformer架構

採用Vision Transformer架構，利用自注意力機制處理圖像

預訓練微調

基於大規模預訓練模型進行微調，適應特定分類任務

圖像分類

特徵提取

計算機視覺

通用圖像分類

對常見物體圖像進行分類識別

在CIFAR10上達到96.78%準確率

圖像理解

提取圖像特徵用於下游任務