V

Vit Base Patch16 224 In21k Finetuned Cassava3

由siddharth963開發
基於Google Vision Transformer (ViT)架構的圖像分類模型,在圖像文件夾數據集上微調,準確率達88.55%
下載量 13
發布時間 : 10/12/2022

模型概述

該模型是基於Google的ViT-base-patch16-224-in21k預訓練模型在特定圖像分類任務上微調的版本,主要用於圖像分類任務。

模型特點

高準確率
在評估集上達到88.55%的分類準確率
基於ViT架構
使用Vision Transformer架構,適合處理圖像數據
遷移學習
基於預訓練模型微調,適應特定分類任務

模型能力

圖像分類
視覺特徵提取

使用案例

農業
木薯病害識別
基於模型名稱推斷可能用於木薯作物病害分類
88.55%的分類準確率
通用圖像分類
通用物體識別
可用於各種圖像分類任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase