V

Vitforimageclassification

由Andron00e開發
該模型是基於google/vit-base-patch16-224-in21k在CIFAR10數據集上微調的圖像分類模型,準確率達96.78%。
下載量 43
發布時間 : 11/28/2023

模型概述

Vision Transformer (ViT) 圖像分類模型,適用於通用圖像分類任務。

模型特點

高準確率
在CIFAR10數據集上達到96.78%的分類準確率
基於Transformer架構
採用Vision Transformer架構,利用自注意力機制處理圖像
預訓練微調
基於大規模預訓練模型進行微調,適應特定分類任務

模型能力

圖像分類
特徵提取

使用案例

計算機視覺
通用圖像分類
對常見物體圖像進行分類識別
在CIFAR10上達到96.78%準確率
圖像理解
提取圖像特徵用於下游任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase