vit-base-patch32-224-in21k-finetuned-eurosat開源模型

首頁

Vit Base Patch32 224 In21k Finetuned Eurosat

由sshreshtha開發

基於Google Vision Transformer (ViT)架構的圖像分類模型，在food101數據集上微調，用於食品圖像分類任務

圖像分類

Transformers

開源協議:Apache-2.0 #食品圖像分類 #高準確率ViT #遷移學習微調

下載量 30

發布時間 : 11/24/2022

模型概述

該模型是基於Vision Transformer架構的預訓練模型，在food101食品分類數據集上進行微調，能夠對101種不同類別的食品圖像進行分類識別

模型特點

基於Vision Transformer架構

採用先進的Transformer架構處理視覺任務，具有強大的特徵提取能力

食品圖像分類

專門針對101類食品圖像優化的分類模型

高準確率

在food101測試集上達到73.21%的分類準確率

模型能力

食品圖像分類

視覺特徵提取

多類別圖像識別

使用案例

食品識別

餐飲業菜品識別

用於餐廳自動識別菜品圖片，實現智能菜單管理

可準確識別101種常見食品類別

健康飲食應用

集成到移動應用中幫助用戶識別食物並記錄飲食

屬性	詳情
模型類型	基於`google/vit-base-patch32-224-in21k`微調的圖像分類模型
訓練數據	food101數據集
評估指標	準確率
評估結果	損失：1.6175；準確率：0.7321

訓練損失	輪數	步數	驗證損失	準確率
2.6483	1.0	532	2.5574	0.6605
1.8885	2.0	1064	1.8063	0.7182
1.6371	3.0	1596	1.6175	0.7321

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Vit Base Patch32 224 In21k Finetuned Eurosat

模型概述

模型特點

模型能力

使用案例

🚀 vit-base-patch32-224-in21k-finetuned-eurosat

🚀 快速開始

📚 詳細文檔

模型信息

訓練過程

訓練超參數

訓練結果

框架版本

📄 許可證