yolos-small-rego-plates-detection开源模型 - 免费部署精准检测车牌

首页

Yolos Small Rego Plates Detection

由 nickmuchi 开发

基于YOLOS架构的小型视觉Transformer模型，专门针对车牌检测任务进行微调

目标检测

Transformers

开源协议:Apache-2.0 #车牌检测专用 #ViT架构 #小目标优化

下载量 400

发布时间 : 7/7/2022

模型简介

该模型是基于YOLOS架构的目标检测模型，经过COCO数据集预训练后，在车牌检测数据集上进行了微调，专门用于车辆和车牌的检测任务。

模型特点

基于Transformer的检测架构

采用视觉Transformer架构，相比传统CNN检测器具有更好的全局建模能力

专门的车牌检测优化

在车牌检测数据集上进行了针对性微调，提升车牌检测性能

轻量级模型

小型模型版本适合资源受限环境部署

模型能力

车辆检测

车牌检测

目标边界框预测

使用案例

智能交通

车牌识别系统

用于自动车牌识别系统中的车牌检测环节

AP@0.5达到0.752

停车场管理

自动检测进出停车场的车辆和车牌

🚀 YOLOS（小尺寸）模型

YOLOS（小尺寸）模型是基于目标检测领域的创新成果，它在原始模型基础上进行了优化和微调，可用于车辆及车牌检测，为相关领域的目标检测任务提供了高效且准确的解决方案。

🚀 快速开始

原始的YOLOS模型在COCO 2017目标检测数据集（118k带注释图像）上进行了微调。该模型由Fang等人在论文You Only Look at One Sequence: Rethinking Transformer in Vision through Object Detection中提出，并首次在此仓库发布。此模型进一步在Kaggle的车牌数据集上进行了微调。该数据集包含735张标注为“车辆”和“车牌”的图像。模型在单个GPU上使用Google Colab训练了200个epoch。

✨ 主要特性

强大的检测能力：YOLOS是使用DETR损失训练的视觉Transformer（ViT）。尽管其结构简单，但基础尺寸的YOLOS模型在COCO 2017验证集上能够达到42 AP（与DETR以及更复杂的框架如Faster R - CNN相当）。
广泛的适用性：可用于目标检测任务，你可以在模型中心查找所有可用的YOLOS模型。

📦 安装指南

文档未提及安装步骤，故跳过此章节。

💻 使用示例

基础用法

from transformers import YolosFeatureExtractor, YolosForObjectDetection
from PIL import Image
import requests

url = 'https://drive.google.com/uc?id=1p9wJIqRz3W50e2f_A0D8ftla8hoXz4T5'
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = YolosFeatureExtractor.from_pretrained('nickmuchi/yolos-small-rego-plates-detection')
model = YolosForObjectDetection.from_pretrained('nickmuchi/yolos-small-rego-plates-detection')
inputs = feature_extractor(images=image, return_tensors="pt")
outputs = model(**inputs)

# model predicts bounding boxes and corresponding face mask detection classes
logits = outputs.logits
bboxes = outputs.pred_boxes

目前，特征提取器和模型都支持PyTorch。

📚 详细文档

模型描述

YOLOS是使用DETR损失训练的视觉Transformer（ViT）。尽管其结构简单，但基础尺寸的YOLOS模型在COCO 2017验证集上能够达到42 AP（与DETR以及更复杂的框架如Faster R - CNN相当）。

预期用途和限制

你可以使用原始模型进行目标检测。请查看模型中心以查找所有可用的YOLOS模型。

训练数据

YOLOS模型在ImageNet - 1k上进行了预训练，并在COCO 2017目标检测数据集上进行了微调，该数据集分别包含118k/5k用于训练/验证的带注释图像。此模型进一步在Kaggle的车牌数据集上进行了微调。该数据集包含735张标注为“车辆”和“车牌”的图像。

评估结果

此模型的平均精度（AP）达到了47.9。

IoU指标：边界框

属性	详情
平均精度 (AP) @[ IoU=0.50:0.95, area= all, maxDets=100 ]	0.479
平均精度 (AP) @[ IoU=0.50, area= all, maxDets=100 ]	0.752
平均精度 (AP) @[ IoU=0.75, area= all, maxDets=100 ]	0.555
平均精度 (AP) @[ IoU=0.50:0.95, area= small, maxDets=100 ]	0.147
平均精度 (AP) @[ IoU=0.50:0.95, area= medium, maxDets=100 ]	0.420
平均精度 (AP) @[ IoU=0.50:0.95, area= large, maxDets=100 ]	0.804
平均召回率 (AR) @[ IoU=0.50:0.95, area= all, maxDets= 1 ]	0.437
平均召回率 (AR) @[ IoU=0.50:0.95, area= all, maxDets= 10 ]	0.641
平均召回率 (AR) @[ IoU=0.50:0.95, area= all, maxDets=100 ]	0.676
平均召回率 (AR) @[ IoU=0.50:0.95, area= small, maxDets=100 ]	0.268
平均召回率 (AR) @[ IoU=0.50:0.95, area= medium, maxDets=100 ]	0.641
平均召回率 (AR) @[ IoU=0.50:0.95, area= large, maxDets=100 ]	0.870