V

Vit Base Patch16 224 In21k Finetuned Cifar10 Album Vitvmmrdb Make Model Album Pred

由venetis開發
基於ViT架構的視覺Transformer模型,在CIFAR-10數據集上微調,用於圖像分類任務
下載量 30
發布時間 : 11/27/2022

模型概述

該模型是基於Google Vision Transformer(ViT)架構的圖像分類模型,經過在CIFAR-10數據集上的微調,能夠對10類常見物體進行準確分類。

模型特點

高準確率
在CIFAR-10測試集上達到85.72%的準確率
基於Transformer架構
採用Vision Transformer(ViT)架構,利用自注意力機制處理圖像
小尺寸圖像處理
專為224x224像素尺寸圖像優化

模型能力

圖像分類
物體識別
視覺特徵提取

使用案例

計算機視覺
CIFAR-10圖像分類
對CIFAR-10數據集中的10類物體進行分類
準確率85.72%
通用物體識別
識別常見物體如飛機、汽車、鳥類等
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase