🚀 YOLOS(小尺寸)模型
YOLOS(小尺寸)模型是基于目标检测领域的创新成果,它在原始模型基础上进行了优化和微调,可用于车辆及车牌检测,为相关领域的目标检测任务提供了高效且准确的解决方案。
🚀 快速开始
原始的YOLOS模型在COCO 2017目标检测数据集(118k带注释图像)上进行了微调。该模型由Fang等人在论文You Only Look at One Sequence: Rethinking Transformer in Vision through Object Detection中提出,并首次在此仓库发布。此模型进一步在Kaggle的车牌数据集上进行了微调。该数据集包含735张标注为“车辆”和“车牌”的图像。模型在单个GPU上使用Google Colab训练了200个epoch。
✨ 主要特性
- 强大的检测能力:YOLOS是使用DETR损失训练的视觉Transformer(ViT)。尽管其结构简单,但基础尺寸的YOLOS模型在COCO 2017验证集上能够达到42 AP(与DETR以及更复杂的框架如Faster R - CNN相当)。
- 广泛的适用性:可用于目标检测任务,你可以在模型中心查找所有可用的YOLOS模型。
📦 安装指南
文档未提及安装步骤,故跳过此章节。
💻 使用示例
基础用法
from transformers import YolosFeatureExtractor, YolosForObjectDetection
from PIL import Image
import requests
url = 'https://drive.google.com/uc?id=1p9wJIqRz3W50e2f_A0D8ftla8hoXz4T5'
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = YolosFeatureExtractor.from_pretrained('nickmuchi/yolos-small-rego-plates-detection')
model = YolosForObjectDetection.from_pretrained('nickmuchi/yolos-small-rego-plates-detection')
inputs = feature_extractor(images=image, return_tensors="pt")
outputs = model(**inputs)
logits = outputs.logits
bboxes = outputs.pred_boxes
目前,特征提取器和模型都支持PyTorch。
📚 详细文档
模型描述
YOLOS是使用DETR损失训练的视觉Transformer(ViT)。尽管其结构简单,但基础尺寸的YOLOS模型在COCO 2017验证集上能够达到42 AP(与DETR以及更复杂的框架如Faster R - CNN相当)。
预期用途和限制
你可以使用原始模型进行目标检测。请查看模型中心以查找所有可用的YOLOS模型。
训练数据
YOLOS模型在ImageNet - 1k上进行了预训练,并在COCO 2017目标检测数据集上进行了微调,该数据集分别包含118k/5k用于训练/验证的带注释图像。此模型进一步在Kaggle的车牌数据集上进行了微调。该数据集包含735张标注为“车辆”和“车牌”的图像。
评估结果
此模型的平均精度(AP)达到了47.9。
IoU指标:边界框
属性 |
详情 |
平均精度 (AP) @[ IoU=0.50:0.95, area= all, maxDets=100 ] |
0.479 |
平均精度 (AP) @[ IoU=0.50, area= all, maxDets=100 ] |
0.752 |
平均精度 (AP) @[ IoU=0.75, area= all, maxDets=100 ] |
0.555 |
平均精度 (AP) @[ IoU=0.50:0.95, area= small, maxDets=100 ] |
0.147 |
平均精度 (AP) @[ IoU=0.50:0.95, area= medium, maxDets=100 ] |
0.420 |
平均精度 (AP) @[ IoU=0.50:0.95, area= large, maxDets=100 ] |
0.804 |
平均召回率 (AR) @[ IoU=0.50:0.95, area= all, maxDets= 1 ] |
0.437 |
平均召回率 (AR) @[ IoU=0.50:0.95, area= all, maxDets= 10 ] |
0.641 |
平均召回率 (AR) @[ IoU=0.50:0.95, area= all, maxDets=100 ] |
0.676 |
平均召回率 (AR) @[ IoU=0.50:0.95, area= small, maxDets=100 ] |
0.268 |
平均召回率 (AR) @[ IoU=0.50:0.95, area= medium, maxDets=100 ] |
0.641 |
平均召回率 (AR) @[ IoU=0.50:0.95, area= large, maxDets=100 ] |
0.870 |
📄 许可证
本模型采用Apache - 2.0许可证。