🚀 YOLOS(小尺寸)模型
YOLOS(小尺寸)模型是基于目标检测和人脸口罩检测的模型,它在COCO 2017目标检测数据集上微调,还在Kaggle的人脸口罩数据集上进一步微调,能有效进行目标检测和人脸口罩检测。
🚀 快速开始
原始的YOLOS模型在COCO 2017目标检测(118k带注释图像)上进行了微调。它由Fang等人在论文You Only Look at One Sequence: Rethinking Transformer in Vision through Object Detection中提出,并首次在此仓库发布。
该模型在Kaggle的人脸口罩数据集上进一步微调。该数据集包含853张带注释的人物图像,注释类别为“戴口罩”、“未戴口罩”和“口罩佩戴不正确”。模型在单个GPU上使用Google Colab训练了200个epoch。
✨ 主要特性
- 强大的目标检测能力:YOLOS是使用DETR损失训练的视觉Transformer(ViT)。尽管简单,但基础尺寸的YOLOS模型在COCO 2017验证集上能够达到42 AP(与DETR和更复杂的框架如Faster R - CNN相当)。
- 多数据集微调:在COCO 2017目标检测数据集和人脸口罩数据集上进行微调,适用于多种目标检测场景。
📦 安装指南
文档未提及安装步骤,暂无法提供。
💻 使用示例
基础用法
from transformers import YolosFeatureExtractor, YolosForObjectDetection
from PIL import Image
import requests
url = 'https://drive.google.com/uc?id=1VwYLbGak5c-2P5qdvfWVOeg7DTDYPbro'
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = YolosFeatureExtractor.from_pretrained('nickmuchi/yolos-small-finetuned-masks')
model = YolosForObjectDetection.from_pretrained('nickmuchi/yolos-small-finetuned-masks')
inputs = feature_extractor(images=image, return_tensors="pt")
outputs = model(**inputs)
logits = outputs.logits
bboxes = outputs.pred_boxes
目前,特征提取器和模型都支持PyTorch。
📚 详细文档
预期用途与限制
你可以使用原始模型进行目标检测。请参阅模型中心以查找所有可用的YOLOS模型。
训练数据
YOLOS模型在ImageNet - 1k上预训练,并在COCO 2017目标检测上微调,该数据集分别包含118k/5k张用于训练/验证的带注释图像。
训练
该模型在人脸口罩数据集上微调了200个epoch。
评估结果
该模型的平均精度(AP)达到了53.2。
正在累积评估结果...
IoU指标:边界框
指标 |
指标参数 |
位置 |
检测数 |
值 |
平均精度 |
(AP) @[ IoU=0.50:0.95 面积= 全部 最大检测数=100 ] |
|
|
0.273 |
平均精度 |
(AP) @[ IoU=0.50 面积= 全部 最大检测数=100 ] |
|
|
0.532 |
平均精度 |
(AP) @[ IoU=0.75 面积= 全部 最大检测数=100 ] |
|
|
0.257 |
平均精度 |
(AP) @[ IoU=0.50:0.95 面积= 小 最大检测数=100 ] |
|
|
0.220 |
平均精度 |
(AP) @[ IoU=0.50:0.95 面积= 中 最大检测数=100 ] |
|
|
0.341 |
平均精度 |
(AP) @[ IoU=0.50:0.95 面积= 大 最大检测数=100 ] |
|
|
0.545 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面积= 全部 最大检测数= 1 ] |
|
|
0.154 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面积= 全部 最大检测数= 10 ] |
|
|
0.361 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面积= 全部 最大检测数=100 ] |
|
|
0.415 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面积= 小 最大检测数=100 ] |
|
|
0.349 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面积= 中 最大检测数=100 ] |
|
|
0.469 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面积= 大 最大检测数=100 ] |
|
|
0.584 |
🔧 技术细节
文档未提供具体的技术实现细节,暂无法提供。
📄 许可证
本模型使用Apache - 2.0许可证。