V

Vit Base Patch16 224 Finetuned Cifar10

由Weili開發
這是一個基於Vision Transformer (ViT)架構的圖像分類模型,在CIFAR10數據集上進行了微調,達到了98.76%的準確率。
下載量 15
發布時間 : 12/7/2022

模型概述

該模型是Google原始ViT模型在CIFAR10數據集上的微調版本,專門用於10類圖像分類任務。

模型特點

高準確率
在CIFAR10測試集上達到98.76%的分類準確率
基於Transformer架構
採用Vision Transformer架構,而非傳統CNN
小圖像處理能力
雖然原始ViT設計用於224x224圖像,但已針對CIFAR10的32x32小圖像進行優化

模型能力

圖像分類
特徵提取

使用案例

計算機視覺
物體識別
識別CIFAR10數據集中的10類常見物體
98.76%準確率
教育演示
用於教學演示Transformer在視覺任務中的應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase