vit - snacks開源零食圖像分類模型，基於特定數據集微調，準確率高達93.9%

Vit Snacks

Developed by Shivagowri

基於ViT架構的零食圖像分類模型，在Matthijs/snacks數據集上微調，準確率達93.9%

Downloads 32

Release Time : 6/29/2022

Model Overview

該模型是基於Google的ViT-base-patch16-224-in21k在零食數據集上微調的版本，專門用於識別20種不同種類的零食圖像。

高準確率

在零食分類任務上達到93.9%的準確率

基於ViT架構

使用Vision Transformer(ViT)作為基礎架構，具有良好的圖像理解能力

輕量級微調

在預訓練模型基礎上僅進行5輪微調，效率高

零食圖像分類

20類零食識別

零售與食品

自動零食分類

用於超市或自動售貨機的零食自動識別系統

可準確識別20種常見零食

飲食記錄應用

幫助用戶通過拍照記錄零食攝入

自動識別並分類用戶攝入的零食