V

Vit Snacks

由Shivagowri開發
基於ViT架構的零食圖像分類模型,在Matthijs/snacks數據集上微調,準確率達93.9%
下載量 32
發布時間 : 6/29/2022

模型概述

該模型是基於Google的ViT-base-patch16-224-in21k在零食數據集上微調的版本,專門用於識別20種不同種類的零食圖像。

模型特點

高準確率
在零食分類任務上達到93.9%的準確率
基於ViT架構
使用Vision Transformer(ViT)作為基礎架構,具有良好的圖像理解能力
輕量級微調
在預訓練模型基礎上僅進行5輪微調,效率高

模型能力

零食圖像分類
20類零食識別

使用案例

零售與食品
自動零食分類
用於超市或自動售貨機的零食自動識別系統
可準確識別20種常見零食
飲食記錄應用
幫助用戶通過拍照記錄零食攝入
自動識別並分類用戶攝入的零食
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase