V

Vit Base Patch16 224 In21k Finetuned Cifar10

由aaraki開發
基於Google Vision Transformer (ViT)架構的預訓練模型,在CIFAR-10數據集上進行了微調,用於圖像分類任務。
下載量 16.69k
發布時間 : 3/30/2022

模型概述

該模型是基於Google的ViT-base-patch16-224-in21k預訓練模型,在CIFAR-10數據集上進行微調後的版本,專門用於10類圖像分類任務。

模型特點

高準確率
在CIFAR-10測試集上達到了97.88%的準確率
基於Transformer架構
採用Vision Transformer架構,利用自注意力機制處理圖像數據
遷移學習
基於ImageNet-21k預訓練模型進行微調,充分利用預訓練知識

模型能力

圖像分類
10類物體識別

使用案例

計算機視覺
CIFAR-10圖像分類
對CIFAR-10數據集中的10類常見物體進行分類
準確率97.88%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase