# 高精度识别

Korean PP OCRv3 Mobile Rec
Apache-2.0
超轻量级韩语文本行识别模型,支持韩语和数字字符识别,平均准确率60.21%。
文字识别 支持多种语言
K
PaddlePaddle
277
0
Latin PP OCRv3 Mobile Rec
Apache-2.0
PaddleOCR团队开发的超轻量级拉丁语文本行识别模型,支持拉丁语和数字字符识别。
文字识别 支持多种语言
L
PaddlePaddle
898
0
Arabic PP OCRv3 Mobile Rec
Apache-2.0
PaddleOCR团队开发的超轻量级阿拉伯字母识别模型,支持阿拉伯字母和数字字符识别。
文字识别 支持多种语言
A
PaddlePaddle
287
0
Hicode R1 Distill Gemma 12B Q8.GGUF
Apache-2.0
一个基于Apache-2.0许可的图像文本转文本模型,能够从图像中提取文本信息并转换为可编辑的文本格式。
图像生成文本
H
tonyli8623
24
1
Medai Resnet50 Brain
MIT
ResNet-50 是一个深度残差网络,由微软研究院开发,广泛用于图像分类任务。
图像分类
M
aryan-anand
31
1
Roberta Base Ai Text Detection V1
Apache-2.0
基于RoBERTa-base微调的模型,用于检测AI生成的英文文本。
文本分类 Transformers 英语
R
fakespot-ai
574
1
Bert Large Uncased Merged
Apache-2.0
这是一个用于钓鱼攻击检测的数据集,主要用于训练BERT模型识别钓鱼网站。
文本分类 Transformers 英语
B
buDujS
92
1
Nicpras Finetuned Yolo
这是一个基于YOLOv3架构进行微调的目标检测模型,专为特定场景下的目标识别任务优化
目标检测 Transformers
N
LykaAustria
24
0
Yolo Roofs
MIT
YOLOv8 是 Ultralytics 开发的一个高效的目标检测模型,基于 YOLO (You Only Look Once) 架构,适用于实时目标检测任务。
目标检测 Transformers 英语
Y
Vara971
15
0
Plant Identification Vit
Apache-2.0
基于Google Vision Transformer (ViT)架构微调的植物识别模型,在评估集上达到80.96%的准确率
图像分类 Transformers
P
marwaALzaabi
37
1
Tiny Random Internvl2
专注于将图像中的文本信息提取并转化为可编辑的文本内容
文字识别 Safetensors
T
katuni4ka
73.27k
0
Videomae Large Finetuned Deepfake Subset
基于MCG-NJU/videomae-large模型在深度伪造检测挑战赛数据集上微调的版本,用于视频深度伪造检测。
视频处理 Transformers
V
shylhy
519
0
Speech Emotion Recognition With Facebook Wav2vec2 Large Xlsr 53
Apache-2.0
基于Wav2Vec2 Large XLSR-53模型微调的语音情感识别系统,能够识别7种常见情感
音频分类 Transformers
S
firdhokk
66
0
Safesql V1
Apache-2.0
基于Keras 3.x训练的恶意SQL检测模型,能识别多种SQL注入攻击向量
文本分类 英语
S
deathsaber93
41
1
Yolov10s
YOLOv10是一种实时目标检测模型,通过消除非极大值抑制(NMS)等后处理步骤,实现了高效且无额外开销的目标检测。
目标检测
Y
kadirnar
15
0
Detr Face Detection
Openrail
一个基于creativeml-openrail-m许可证的人脸检测模型,支持英文语言,主要用于目标检测任务。
目标检测 Transformers 英语
D
diffusionai
108
1
Yolov10x
YOLOv10是一种实时端到端目标检测模型,具有高效的推理速度和较高的检测精度。
目标检测 Transformers
Y
onnx-community
23
6
Yolov10n
YOLOv10是一种实时端到端目标检测模型,具有高效的延迟-精度和尺寸-精度权衡。
目标检测 Transformers
Y
onnx-community
21
6
Yolov10b
YOLOv10是实时端到端目标检测模型,提供高效的检测性能和精度平衡。
目标检测 Transformers
Y
onnx-community
14
1
Yolov10s
YOLOv10是清华大学MIG实验室开发的高效实时目标检测模型,提供端到端检测能力。
目标检测 Transformers
Y
onnx-community
13
7
Trocr Base Finetune Numbers
TrOCR 是一个基于Transformer的光学字符识别模型,用于从图像中提取文本内容。
图像生成文本 Transformers 英语
T
ANANDHU-SCT
23
0
Trocr Base Plate Number
Apache-2.0
一个用于识别车辆牌照的视觉模型示例,能够从图片中提取车牌号码。
文字识别 Transformers
T
ghanahmada
100
1
MAGE
Apache-2.0
MAGE是一个用于检测开放环境下机器生成文本的模型,旨在识别由AI生成的文本内容。
大型语言模型 Transformers
M
yaful
742
1
Xlm Roberta Base Language Detection ONNX
基于XLM-RoBERTa的多语言检测模型,能够识别文本的语言类别。
文本分类 Transformers
X
Oblix
16
1
Donut Cn Invoice
一个专注于中文发票识别的AI模型,能够准确提取发票中的关键信息。
大型语言模型 Transformers 中文
D
ewfian
32
0
SMS Spam Detection BertForSequenceClassification
使用BERT进行微调的短信分类模型,用于区分垃圾信息和非垃圾信息。
文本分类 Transformers 英语
S
andresar1205
135
2
Convnextv2 Large DogBreed
Apache-2.0
该模型是基于facebook/convnextv2-large-22k-224在狗品种分类数据集上微调的版本,在评估集上准确率达到91.39%。
图像分类 Transformers
C
Pavarissy
184
6
Trocr Base Fa V2
这是一个基于Transformer的OCR模型,专门用于识别波斯语文本图像。
文字识别 其他
T
hezarai
64
3
Fashion Images Gender Age Vit Large Patch16 224 In21k V3
Apache-2.0
该模型是基于Google的ViT-Large架构在时尚图像性别年龄分类数据集上微调的视觉Transformer模型,在评估集上取得了99.6%的准确率。
图像分类 Transformers
F
touchtech
286
5
Image2ingredients
Openrail
一个能够将图像内容转换为文本描述的模型,适用于多种视觉理解任务。
图像生成文本 Transformers
I
SumanthKarnati
22
0
Plant Vit Model 1
Apache-2.0
基于ViT架构的植物图像分类模型,在未知数据集上微调后达到99.95%的验证准确率
图像分类 Transformers
P
Carina124
89
1
Detr Resnet 101
基于Transformer架构的端到端目标检测模型,结合ResNet-101特征提取器
目标检测 Transformers
D
Xenova
216
2
Leafcondition
一个用于叶片状态分类的视觉模型,能够准确识别和分析植物叶片的健康状况。
图像分类 Transformers
L
OttoYu
16
0
My Awesome Food Model
Apache-2.0
基于Google的ViT模型在food101数据集上微调的食品分类模型
图像分类 Transformers
M
jinkasreedhar
16
0
My Food Model
Apache-2.0
基于Google Vision Transformer (ViT)架构的食品图像分类模型,在Food101数据集上微调,准确率达90.9%
图像分类 Transformers
M
iammartian0
18
0
Microsoft Resnet 50 Cartoon Face Recognition
Apache-2.0
基于microsoft/resnet-50微调的卡通人脸识别模型,在图像分类任务上表现良好。
人脸相关 Transformers
M
jayanta
63
2
My Awesome Food Model
Apache-2.0
基于ViT架构的食品图像分类模型,在Food101数据集上微调,准确率达89.7%
图像分类 Transformers
M
asd0936
38
0
Convnext Tiny 224 Finetuned Eurosat Vitconfig Test
该模型是基于图像文件夹数据集对ConvNeXt-Tiny进行微调的版本,适用于图像分类任务。
图像分类 Transformers
C
polejowska
13
0
Vit Base Highways 2
Apache-2.0
基于google/vit-base-patch16-224-in21k微调的视觉Transformer模型,在未知数据集上达到70%准确率
图像分类 Transformers
V
ogimgio
14
0
Autotrain Dogs And Cats 1527055142
使用AutoTrain训练的二元分类模型,能够准确区分猫和狗的图片
图像分类 Transformers
A
omarques
34
2
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase