vit-base-roman-numeral開源模型 - 精準實現羅馬數字圖像分類，準確率超83%

首頁

Vit Base Roman Numeral

由farleyknight開發

基於ViT架構的羅馬數字圖像分類模型，在farleyknight/roman_numerals數據集上微調，準確率達83.09%

圖像分類

Transformers

開源協議:Apache-2.0 #羅馬數字識別 #高精度分類 #ViT微調

下載量 13

發布時間 : 8/24/2022

模型概述

該模型是基於google/vit-base-patch16-224-in21k在羅馬數字識別數據集上微調的視覺Transformer模型，專門用於識別圖像中的羅馬數字符號。

模型特點

高精度識別

在羅馬數字測試集上達到83.09%的準確率

基於ViT架構

採用Vision Transformer基礎架構，具有強大的圖像特徵提取能力

輕量級微調

在預訓練模型基礎上進行高效微調，節省訓練資源

模型能力

圖像分類

羅馬數字識別

視覺特徵提取

使用案例

教育技術

歷史文檔數字化

自動識別古籍或歷史文檔中的羅馬數字

83.09%的識別準確率

教育應用開發

用於開發羅馬數字學習應用中的自動批改功能

文檔處理

自動文檔分類

根據羅馬數字頁碼自動分類文檔

訓練損失	輪數	步數	驗證損失	準確率
1.9053	1.0	289	1.3241	0.7108
1.3293	2.0	578	0.9333	0.7892
1.1251	3.0	867	0.7989	0.7843
0.9837	4.0	1156	0.6956	0.8186
0.999	5.0	1445	0.6891	0.8309

屬性	詳情
模型類型	圖像分類模型
訓練數據	farleyknight/roman_numerals 數據集
評估指標	準確率

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Vit Base Roman Numeral

模型概述

模型特點

模型能力

使用案例

🚀 vit-base-roman-numeral

🚀 快速開始

🔧 技術細節

訓練超參數

訓練結果

框架版本

📄 許可證