V

Vit Base Patch16 224 Finetuned Eurosat

由Weili開發
基於ViT架構的視覺Transformer模型,在圖像分類任務上微調後達到98.89%的準確率
下載量 32
發布時間 : 12/7/2022

模型概述

該模型是基於Google的ViT-base-patch16-224預訓練模型,在圖像文件夾數據集上進行微調得到的圖像分類模型。主要用於高精度圖像分類任務。

模型特點

高準確率
在評估集上達到98.89%的分類準確率
基於ViT架構
使用Vision Transformer架構,具有強大的圖像特徵提取能力
高效微調
僅需3個訓練輪次即可達到高性能

模型能力

圖像分類
視覺特徵提取

使用案例

遙感圖像分析
土地覆蓋分類
對衛星圖像中的土地覆蓋類型進行分類
準確率可達98.89%
通用圖像分類
物體識別
識別圖像中的主要物體類別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase