V

Vit Finetuned Food101

由ashaduzzaman開發
這是一個在Food-101數據集上微調的視覺Transformer模型,用於食物圖像分類任務。
下載量 162
發布時間 : 8/28/2024

模型概述

該模型基於Google的ViT架構,專門針對101種食物類別進行優化,適用於飲食追蹤、餐廳菜單分析等場景。

模型特點

高準確率食物分類
在Food-101測試集上達到89.6%的準確率,能夠準確識別101種不同食物類別。
基於ViT架構
採用視覺Transformer架構,利用自注意力機制捕捉圖像全局特徵。
遷移學習優化
基於預訓練的ViT模型進行微調,有效利用大規模圖像數據學習到的特徵。

模型能力

食物圖像分類
多類別識別
飲食分析

使用案例

飲食健康
自動食物記錄
幫助用戶通過拍照自動記錄飲食內容
準確識別101種常見食物
餐飲行業
菜單分析
自動分析餐廳菜單中的食物分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase