开源finetuned-ViT-Indian-Food-Classification-v3模型

首页

Finetuned ViT Indian Food Classification V3

由 DrishtiSharma 开发

该模型是基于google/vit-base-patch16-224-in21k在Human_Action_Recognition数据集上微调的图像分类模型，准确率达到93.84%。

图像分类

Transformers

开源协议:Apache-2.0 #高精度图像分类 #ViT微调模型 #动作识别

下载量 60

发布时间 : 9/3/2022

模型简介

这是一个基于Vision Transformer (ViT)架构的图像分类模型，专门用于识别印度食物类别。模型在Human_Action_Recognition数据集上进行了微调，表现出色。

模型特点

高准确率

在评估集上达到93.84%的准确率，表现优异

基于ViT架构

采用先进的Vision Transformer架构，能有效捕捉图像全局特征

高效微调

在预训练模型基础上进行高效微调，节省训练资源

模型能力

图像分类

食物识别

视觉特征提取

使用案例

餐饮行业

自动菜品识别

用于餐厅或外卖平台的自动菜品分类系统

可准确识别印度各类食物

健康应用

饮食记录辅助

帮助用户自动记录饮食内容的移动应用

自动识别食物类型，简化记录流程

🚀 微调版ViT印度食品分类模型v3

该模型是基于 google/vit-base-patch16-224-in21k 在Human_Action_Recognition数据集上进行微调的版本。它在评估集上取得了以下成绩：

损失值：0.2878
准确率：0.9384

📚 详细文档

模型描述

需补充更多信息。

预期用途与限制

需补充更多信息。

训练和评估数据

需补充更多信息。

🔧 技术细节

训练过程

训练超参数

训练过程中使用了以下超参数：

学习率：0.0002
训练批次大小：16
评估批次大小：8
随机种子：42
优化器：Adam，β值为(0.9, 0.999)，ε值为1e - 08
学习率调度器类型：线性
训练轮数：10
混合精度训练：原生自动混合精度（Native AMP）

训练结果

训练损失	轮数	步数	验证损失	准确率
1.1913	0.3	100	0.9307	0.8395
0.6846	0.6	200	0.5650	0.8852
0.5783	0.9	300	0.5147	0.8895
0.5635	1.2	400	0.5310	0.8650
0.4487	1.5	500	0.4155	0.8980
0.2803	1.8	600	0.3848	0.9012
0.4496	2.1	700	0.4308	0.8852
0.4071	2.4	800	0.4004	0.8905
0.3747	2.7	900	0.3795	0.8927
0.2665	3.0	1000	0.3618	0.8927
0.3696	3.3	1100	0.3588	0.8990
0.2808	3.6	1200	0.3794	0.8884
0.158	3.9	1300	0.3416	0.9054
0.2062	4.2	1400	0.3686	0.8916
0.2039	4.5	1500	0.3219	0.9118
0.2392	4.8	1600	0.3392	0.9086
0.1276	5.11	1700	0.3249	0.9192
0.1812	5.41	1800	0.2970	0.9245
0.1352	5.71	1900	0.3366	0.9118
0.1333	6.01	2000	0.3111	0.9203
0.189	6.31	2100	0.3604	0.9139
0.1048	6.61	2200	0.3496	0.9171
0.0913	6.91	2300	0.3046	0.9224
0.1678	7.21	2400	0.3154	0.9288
0.0705	7.51	2500	0.3229	0.9235
0.1057	7.81	2600	0.2895	0.9330
0.1219	8.11	2700	0.2984	0.9299
0.0521	8.41	2800	0.3083	0.9288
0.1181	8.71	2900	0.3020	0.9288
0.1339	9.01	3000	0.2885	0.9373
0.2393	9.31	3100	0.2895	0.9277
0.1044	9.61	3200	0.2912	0.9362
0.096	9.91	3300	0.2878	0.9384

框架版本

Transformers 4.21.2
Pytorch 1.12.1+cu113
Datasets 2.4.0
Tokenizers 0.12.1

📄 许可证

本模型采用Apache 2.0许可证。

🔍 模型信息

属性	详情
模型类型	图像分类
训练数据	Human_Action_Recognition（图像文件夹格式）
评估指标	准确率
模型名称	finetuned - ViT - Indian - Food - Classification - v3