Vit Base Patch32 224 In21 Leicester Binary

V

Vit Base Patch32 224 In21 Leicester Binary

由davanstrien開發

基於Google Vision Transformer (ViT)架構的二分類圖像分類模型，在特定數據集上微調實現高精度分類

開源協議:Apache-2.0 #高精度圖像分類 #ViT架構 #二分類專用

下載量 15

發布時間 : 12/6/2022

模型概述

這是一個基於ViT架構的視覺Transformer模型，專門針對二分類任務進行了微調，在評估集上表現出色（F1分數0.9873）。

模型特點

高精度分類

在評估集上達到0.9873的F1分數，表現優異

基於ViT架構

採用Vision Transformer架構，利用自注意力機制處理圖像

高效微調

基於預訓練模型進行微調，節省訓練資源

模型能力

圖像分類

二分類任務處理

視覺特徵提取

使用案例

醫學影像分析

病變檢測

用於識別醫學影像中的特定病變特徵

工業質檢

缺陷產品檢測

識別生產線上的缺陷產品

🚀 vit-base-patch32-224-in21-leicester_binary

該模型是 google/vit-base-patch32-224-in21k 在 davanstrien/leicester_loaded_annotations_binary 數據集上的微調版本。它在評估集上取得了以下成果：

損失值：0.0628
F1值：0.9873

🚀 快速開始

此模型是基於 google/vit-base-patch32-224-in21k 進行微調得到的，可用於圖像分類任務。

📚 詳細文檔

模型描述

該模型是在 google/vit-base-patch32-224-in21k 基礎上，針對 davanstrien/leicester_loaded_annotations_binary 數據集進行微調。

預期用途和限制

文檔暫未提供相關信息。

訓練和評估數據

文檔暫未提供相關信息。

訓練過程

訓練超參數

訓練過程中使用了以下超參數：

學習率：2e-05
訓練批次大小：64
評估批次大小：128
隨機種子：1337
優化器：Adam（β1=0.9，β2=0.999，ε=1e-08）
學習率調度器類型：線性
訓練輪數：40.0
混合精度訓練：Native AMP

訓練結果

訓練損失	輪數	步數	驗證損失	F1值
無日誌	1.0	7	0.4529	0.8608
0.5024	2.0	14	0.3989	0.8608
0.3533	3.0	21	0.3741	0.8608
0.3533	4.0	28	0.3161	0.8608
0.285	5.0	35	0.2824	0.8608
0.2491	6.0	42	0.2701	0.8608
0.2491	7.0	49	0.2062	0.9114
0.2032	8.0	56	0.2050	0.9494
0.157	9.0	63	0.2013	0.9494
0.1127	10.0	70	0.1960	0.9367
0.1127	11.0	77	0.1417	0.9494
0.0903	12.0	84	0.1307	0.9494
0.0922	13.0	91	0.0870	0.9873
0.0922	14.0	98	0.2048	0.9241
0.0595	15.0	105	0.1204	0.9620
0.0527	16.0	112	0.2553	0.9367
0.0527	17.0	119	0.1675	0.9367
0.0477	18.0	126	0.2265	0.9241
0.0411	19.0	133	0.1901	0.9367
0.0299	20.0	140	0.2423	0.9241
0.0299	21.0	147	0.0639	0.9873
0.0487	22.0	154	0.1255	0.9494
0.0359	23.0	161	0.1213	0.9494
0.0359	24.0	168	0.0727	0.9747
0.0302	25.0	175	0.1116	0.9494
0.0304	26.0	182	0.1062	0.9494
0.0304	27.0	189	0.2097	0.9241
0.0274	28.0	196	0.1276	0.9494
0.0291	29.0	203	0.0967	0.9494
0.0202	30.0	210	0.0765	0.9747
0.0202	31.0	217	0.0628	0.9873
0.0232	32.0	224	0.1388	0.9494
0.0264	33.0	231	0.1062	0.9494
0.0264	34.0	238	0.1320	0.9494
0.0219	35.0	245	0.1528	0.9494
0.0194	36.0	252	0.1746	0.9494
0.0194	37.0	259	0.1609	0.9494
0.0204	38.0	266	0.1482	0.9494
0.0217	39.0	273	0.1522	0.9494
0.0216	40.0	280	0.1499	0.9494

框架版本

Transformers 4.26.0.dev0
Pytorch 1.12.1+cu113
Datasets 2.7.1
Tokenizers 0.13.2

📄 許可證

本模型採用 Apache-2.0 許可證。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase