Vit Base Patch16 224 In21k Finetuned Cifar10 Album Vitvmmrdb Make Model Album Pred

V

Vit Base Patch16 224 In21k Finetuned Cifar10 Album Vitvmmrdb Make Model Album Pred

由venetis開發

基於ViT架構的視覺Transformer模型，在CIFAR-10數據集上微調，用於圖像分類任務

開源協議:Apache-2.0 #圖像分類 #高準確率 #ViT架構

下載量 30

發布時間 : 11/27/2022

模型概述

該模型是基於Google Vision Transformer(ViT)架構的圖像分類模型，經過在CIFAR-10數據集上的微調，能夠對10類常見物體進行準確分類。

模型特點

高準確率

在CIFAR-10測試集上達到85.72%的準確率

基於Transformer架構

採用Vision Transformer(ViT)架構，利用自注意力機制處理圖像

小尺寸圖像處理

專為224x224像素尺寸圖像優化

模型能力

圖像分類

物體識別

視覺特徵提取

使用案例

計算機視覺

CIFAR-10圖像分類

對CIFAR-10數據集中的10類物體進行分類

準確率85.72%

通用物體識別

識別常見物體如飛機、汽車、鳥類等

🚀 vit-base-patch16-224-in21k-finetuned-cifar10_album_vitVMMRdb_make_model_album_pred

本模型是在 aaraki/vit-base-patch16-224-in21k-finetuned-cifar10 基礎上針對 None 數據集進行微調的版本。它在評估集上取得了以下結果：

損失值：0.5462
準確率：0.8594
精確率：0.8556
召回率：0.8594
F1值：0.8544

📚 詳細文檔

模型描述

暫無更多信息。

預期用途與限制

暫無更多信息。

訓練和評估數據

暫無更多信息。

訓練過程

訓練超參數

訓練過程中使用了以下超參數：

學習率：5e - 05
訓練批次大小：64
評估批次大小：64
隨機種子：42
梯度累積步數：4
總訓練批次大小：256
優化器：Adam（β1 = 0.9，β2 = 0.999，ε = 1e - 08）
學習率調度器類型：線性
學習率調度器預熱比例：0.1
訓練輪數：15

訓練結果

訓練損失	輪數	步數	驗證損失	準確率	精確率	召回率	F1值
4.6112	1.0	839	4.5615	0.1425	0.0837	0.1425	0.0646
3.1177	2.0	1678	2.9595	0.4240	0.3424	0.4240	0.3283
2.0793	3.0	2517	2.0048	0.5771	0.5081	0.5771	0.5029
1.4566	4.0	3356	1.4554	0.6760	0.6333	0.6760	0.6280
1.1307	5.0	4195	1.1319	0.7350	0.7027	0.7350	0.7013
0.9367	6.0	5034	0.9328	0.7738	0.7546	0.7738	0.7503
0.7783	7.0	5873	0.8024	0.7986	0.7893	0.7986	0.7819
0.6022	8.0	6712	0.7187	0.8174	0.8098	0.8174	0.8055
0.5234	9.0	7551	0.6635	0.8313	0.8220	0.8313	0.8217
0.4298	10.0	8390	0.6182	0.8388	0.8337	0.8388	0.8302
0.3618	11.0	9229	0.5953	0.8455	0.8394	0.8455	0.8382
0.3262	12.0	10068	0.5735	0.8501	0.8443	0.8501	0.8436
0.3116	13.0	10907	0.5612	0.8527	0.8488	0.8527	0.8471
0.2416	14.0	11746	0.5524	0.8558	0.8500	0.8558	0.8496
0.2306	15.0	12585	0.5489	0.8572	0.8525	0.8572	0.8519

框架版本

Transformers 4.24.0
Pytorch 1.12.1 + cu113
Datasets 2.7.1
Tokenizers 0.13.2

📄 許可證

本項目採用 Apache - 2.0 許可證。

屬性	詳情
模型類型	基於微調的 vit - base - patch16 - 224 - in21k 模型
評估指標	準確率、精確率、召回率、F1值

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase