vit-base-patch16-224-in21k-finetuned-cassava3開源圖像分類模型

Vit Base Patch16 224 In21k Finetuned Cassava3

由siddharth963開發

基於Google Vision Transformer (ViT)架構的圖像分類模型，在圖像文件夾數據集上微調，準確率達88.55%

下載量 13

發布時間 : 10/12/2022

模型概述

該模型是基於Google的ViT-base-patch16-224-in21k預訓練模型在特定圖像分類任務上微調的版本，主要用於圖像分類任務。

高準確率

在評估集上達到88.55%的分類準確率

基於ViT架構

使用Vision Transformer架構，適合處理圖像數據

遷移學習

基於預訓練模型微調，適應特定分類任務

圖像分類

視覺特徵提取

農業

木薯病害識別

基於模型名稱推斷可能用於木薯作物病害分類

88.55%的分類準確率

通用圖像分類

通用物體識別

可用於各種圖像分類任務