開源finetuned-ViT-Indian-Food-Classification-v3模型

首頁

Finetuned ViT Indian Food Classification V3

由DrishtiSharma開發

該模型是基於google/vit-base-patch16-224-in21k在Human_Action_Recognition數據集上微調的圖像分類模型，準確率達到93.84%。

圖像分類

Transformers

開源協議:Apache-2.0 #高精度圖像分類 #ViT微調模型 #動作識別

下載量 60

發布時間 : 9/3/2022

模型概述

這是一個基於Vision Transformer (ViT)架構的圖像分類模型，專門用於識別印度食物類別。模型在Human_Action_Recognition數據集上進行了微調，表現出色。

模型特點

高準確率

在評估集上達到93.84%的準確率，表現優異

基於ViT架構

採用先進的Vision Transformer架構，能有效捕捉圖像全局特徵

高效微調

在預訓練模型基礎上進行高效微調，節省訓練資源

模型能力

圖像分類

食物識別

視覺特徵提取

使用案例

餐飲行業

自動菜品識別

用於餐廳或外賣平臺的自動菜品分類系統

可準確識別印度各類食物

健康應用

飲食記錄輔助

幫助用戶自動記錄飲食內容的移動應用

自動識別食物類型，簡化記錄流程

🚀 微調版ViT印度食品分類模型v3

該模型是基於 google/vit-base-patch16-224-in21k 在Human_Action_Recognition數據集上進行微調的版本。它在評估集上取得了以下成績：

損失值：0.2878
準確率：0.9384

📚 詳細文檔

模型描述

需補充更多信息。

預期用途與限制

需補充更多信息。

訓練和評估數據

需補充更多信息。

🔧 技術細節

訓練過程

訓練超參數

訓練過程中使用了以下超參數：

學習率：0.0002
訓練批次大小：16
評估批次大小：8
隨機種子：42
優化器：Adam，β值為(0.9, 0.999)，ε值為1e - 08
學習率調度器類型：線性
訓練輪數：10
混合精度訓練：原生自動混合精度（Native AMP）

訓練結果

訓練損失	輪數	步數	驗證損失	準確率
1.1913	0.3	100	0.9307	0.8395
0.6846	0.6	200	0.5650	0.8852
0.5783	0.9	300	0.5147	0.8895
0.5635	1.2	400	0.5310	0.8650
0.4487	1.5	500	0.4155	0.8980
0.2803	1.8	600	0.3848	0.9012
0.4496	2.1	700	0.4308	0.8852
0.4071	2.4	800	0.4004	0.8905
0.3747	2.7	900	0.3795	0.8927
0.2665	3.0	1000	0.3618	0.8927
0.3696	3.3	1100	0.3588	0.8990
0.2808	3.6	1200	0.3794	0.8884
0.158	3.9	1300	0.3416	0.9054
0.2062	4.2	1400	0.3686	0.8916
0.2039	4.5	1500	0.3219	0.9118
0.2392	4.8	1600	0.3392	0.9086
0.1276	5.11	1700	0.3249	0.9192
0.1812	5.41	1800	0.2970	0.9245
0.1352	5.71	1900	0.3366	0.9118
0.1333	6.01	2000	0.3111	0.9203
0.189	6.31	2100	0.3604	0.9139
0.1048	6.61	2200	0.3496	0.9171
0.0913	6.91	2300	0.3046	0.9224
0.1678	7.21	2400	0.3154	0.9288
0.0705	7.51	2500	0.3229	0.9235
0.1057	7.81	2600	0.2895	0.9330
0.1219	8.11	2700	0.2984	0.9299
0.0521	8.41	2800	0.3083	0.9288
0.1181	8.71	2900	0.3020	0.9288
0.1339	9.01	3000	0.2885	0.9373
0.2393	9.31	3100	0.2895	0.9277
0.1044	9.61	3200	0.2912	0.9362
0.096	9.91	3300	0.2878	0.9384

框架版本

Transformers 4.21.2
Pytorch 1.12.1+cu113
Datasets 2.4.0
Tokenizers 0.12.1

📄 許可證

本模型採用Apache 2.0許可證。

🔍 模型信息

屬性	詳情
模型類型	圖像分類
訓練數據	Human_Action_Recognition（圖像文件夾格式）
評估指標	準確率
模型名稱	finetuned - ViT - Indian - Food - Classification - v3