Cvt 13 384 In22k FV Finetuned Memes

C

Cvt 13 384 In22k FV Finetuned Memes

由jayanta開發

基於microsoft/cvt-13-384-22k在圖像文件夾數據集上微調的圖像分類模型，在評估集上準確率達到83.46%

開源協議:Apache-2.0 #高精度圖像分類 #表情包識別 #遷移學習優化

下載量 11

發布時間 : 10/21/2022

模型概述

該模型是微軟CVT架構的變體，專門針對圖像分類任務進行微調，特別適用於表情包分類場景。

模型特點

高準確率

在圖像分類任務上達到83.46%的準確率

基於CVT架構

採用微軟CVT視覺變換器架構，具有強大的特徵提取能力

微調優化

在特定數據集上進行精細調優，提升特定場景表現

模型能力

圖像分類

特徵提取

視覺模式識別

使用案例

內容分類

表情包分類

對互聯網表情包進行自動分類

準確率83.46%

內容審核

圖像內容識別

識別圖像中的特定內容類別

🚀 cvt-13-384-in22k-FV-finetuned-memes

該模型是 microsoft/cvt-13-384-22k 在 imagefolder 數據集上的微調版本。它在評估集上取得了以下成績：

損失值：0.5595
準確率：0.8346
精確率：0.8327
召回率：0.8346
F1值：0.8322

📚 詳細文檔

模型描述

更多信息待補充。

預期用途和限制

更多信息待補充。

訓練和評估數據

更多信息待補充。

訓練過程

訓練超參數

訓練過程中使用了以下超參數：

學習率：0.00012
訓練批次大小：64
評估批次大小：64
隨機種子：42
梯度累積步數：4
總訓練批次大小：256
優化器：Adam，β值=(0.9, 0.999)，ε值=1e - 08
學習率調度器類型：線性
學習率調度器熱身比例：0.1
訓練輪數：20

訓練結果

訓練損失	輪數	步數	驗證損失	準確率	精確率	召回率	F1值
1.4066	0.99	20	1.2430	0.5124	0.5141	0.5124	0.4371
1.0813	1.99	40	0.8244	0.6893	0.6834	0.6893	0.6616
0.8392	2.99	60	0.6334	0.7612	0.7670	0.7612	0.7570
0.7065	3.99	80	0.5819	0.7767	0.7799	0.7767	0.7672
0.5751	4.99	100	0.5365	0.8176	0.8216	0.8176	0.8130
0.4896	5.99	120	0.4943	0.8308	0.8257	0.8308	0.8265
0.4487	6.99	140	0.5399	0.8107	0.8069	0.8107	0.8054
0.4349	7.99	160	0.4892	0.8300	0.8285	0.8300	0.8273
0.43	8.99	180	0.4984	0.8454	0.8465	0.8454	0.8426
0.4372	9.99	200	0.5573	0.8192	0.8221	0.8192	0.8157
0.3994	10.99	220	0.5158	0.8300	0.8284	0.8300	0.8281
0.3883	11.99	240	0.5495	0.8354	0.8317	0.8354	0.8314
0.406	12.99	260	0.5298	0.8284	0.8285	0.8284	0.8246
0.3355	13.99	280	0.5401	0.8393	0.8346	0.8393	0.8357
0.395	14.99	300	0.5915	0.8308	0.8278	0.8308	0.8261
0.3612	15.99	320	0.5852	0.8408	0.8378	0.8408	0.8368
0.3765	16.99	340	0.5509	0.8385	0.8351	0.8385	0.8356
0.3688	17.99	360	0.5668	0.8416	0.8398	0.8416	0.8387
0.3503	18.99	380	0.5626	0.8393	0.8371	0.8393	0.8365
0.3611	19.99	400	0.5595	0.8346	0.8327	0.8346	0.8322

框架版本

Transformers 4.24.0.dev0
Pytorch 1.11.0+cu102
Datasets 2.6.1.dev0
Tokenizers 0.13.1

📄 許可證

本模型採用 Apache - 2.0 許可證。

📊 相關指標

屬性	詳情
生成來源	由訓練器生成
數據集	imagefolder
評估指標	準確率、精確率、召回率、F1值

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase