V

Vit Base Roman Numeral

由 farleyknight 开发
基于ViT架构的罗马数字图像分类模型,在farleyknight/roman_numerals数据集上微调,准确率达83.09%
下载量 13
发布时间 : 8/24/2022

模型简介

该模型是基于google/vit-base-patch16-224-in21k在罗马数字识别数据集上微调的视觉Transformer模型,专门用于识别图像中的罗马数字符号。

模型特点

高精度识别
在罗马数字测试集上达到83.09%的准确率
基于ViT架构
采用Vision Transformer基础架构,具有强大的图像特征提取能力
轻量级微调
在预训练模型基础上进行高效微调,节省训练资源

模型能力

图像分类
罗马数字识别
视觉特征提取

使用案例

教育技术
历史文档数字化
自动识别古籍或历史文档中的罗马数字
83.09%的识别准确率
教育应用开发
用于开发罗马数字学习应用中的自动批改功能
文档处理
自动文档分类
根据罗马数字页码自动分类文档
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase