V

Vit Base Patch16 224 In21k Snacks

由matteopilotto開發
基於ImageNet-21k預訓練的Vision Transformer模型,專門針對零食圖像分類任務進行微調
下載量 37
發布時間 : 5/14/2022

模型概述

該模型是在ImageNet-21k上預訓練的Vision Transformer,並在Matthijs/snacks零食數據集上進行了微調,專門用於零食圖像分類任務。

模型特點

高精度分類
在零食測試集上達到89.29%的準確率
數據增強
使用了多種數據增強技術,包括隨機裁剪、水平翻轉和銳度調整
遷移學習
基於ImageNet-21k大規模預訓練模型進行微調

模型能力

零食圖像分類
食品識別
視覺特徵提取

使用案例

零售與餐飲
自動結賬系統
用於超市自動識別顧客選購的零食商品
可替代人工掃碼,提高結賬效率
食品庫存管理
自動識別貨架上的零食商品
幫助即時監控庫存情況
健康與營養
飲食記錄應用
通過拍照自動記錄用戶攝入的零食
幫助用戶追蹤飲食習慣
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase