V

Vit Base Patch16 224 In21k Finetuned Cifar10

由nielsr開發
這是一個基於 Google 的 ViT 基礎模型,在 CIFAR10 數據集上進行微調後的視覺 Transformer 模型,用於圖像分類任務。
下載量 31
發布時間 : 3/2/2022

模型概述

該模型是基於 Vision Transformer (ViT) 架構的圖像分類模型,在 CIFAR10 數據集上微調後達到了 98.81% 的準確率。

模型特點

高準確率
在 CIFAR10 測試集上達到了 98.81% 的分類準確率
基於 Transformer 架構
使用 Vision Transformer (ViT) 架構,適合處理圖像數據
預訓練模型微調
基於 google/vit-base-patch16-224-in21k 預訓練模型進行微調

模型能力

圖像分類
視覺特徵提取

使用案例

計算機視覺
CIFAR10 圖像分類
對 CIFAR10 數據集中的圖像進行分類
準確率達到 98.81%
通用圖像分類
可用於其他類似規模的圖像分類任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase