V

Vit Base 224 In21k Ft Cifar10

由edumunozsala開發
基於Vision Transformer架構的西班牙語圖像分類模型,在CIFAR-10數據集上微調,準確率達97%。
下載量 16
發布時間 : 6/11/2022

模型概述

該模型使用亞馬遜SageMaker和Hugging Face深度學習容器進行訓練,基礎模型是Vision Transformer(基礎尺寸模型),在ImageNet-21k數據集上預訓練,並在CIFAR-10數據集上微調,用於圖像分類任務。

模型特點

高準確率
在CIFAR-10數據集上達到97%的準確率。
基於Vision Transformer
使用Transformer編碼器架構,適用於圖像分類任務。
微調模型
在ImageNet-21k上預訓練,並在CIFAR-10數據集上微調。

模型能力

圖像分類
高精度識別

使用案例

圖像識別
CIFAR-10圖像分類
用於對CIFAR-10數據集中的圖像進行分類。
準確率97%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase