V

Vit Base Patch32 224 In21k Finetuned Eurosat

由sshreshtha開發
基於Google Vision Transformer (ViT)架構的圖像分類模型,在food101數據集上微調,用於食品圖像分類任務
下載量 30
發布時間 : 11/24/2022

模型概述

該模型是基於Vision Transformer架構的預訓練模型,在food101食品分類數據集上進行微調,能夠對101種不同類別的食品圖像進行分類識別

模型特點

基於Vision Transformer架構
採用先進的Transformer架構處理視覺任務,具有強大的特徵提取能力
食品圖像分類
專門針對101類食品圖像優化的分類模型
高準確率
在food101測試集上達到73.21%的分類準確率

模型能力

食品圖像分類
視覺特徵提取
多類別圖像識別

使用案例

食品識別
餐飲業菜品識別
用於餐廳自動識別菜品圖片,實現智能菜單管理
可準確識別101種常見食品類別
健康飲食應用
集成到移動應用中幫助用戶識別食物並記錄飲食
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase