🚀 RT-DETRv2
RT-DETRv2是一个用于实时目标检测的模型,它在RT-DETR的基础上进行了改进,引入了选择性多尺度特征提取等技术,在保持实时性能的同时,增强了模型的灵活性和实用性。
✨ 主要特性
- 性能提升:在所有模型尺寸上,RT-DETRv2始终优于其前身,同时保持相同的实时速度。
- 技术改进:引入选择性多尺度特征提取、离散采样算子,采用动态数据增强和尺度自适应超参数等训练策略。
- 应用广泛:适用于自动驾驶、监控系统、机器人技术和零售分析等多种实时目标检测场景。
📦 安装指南
文档未提及具体安装步骤,故跳过此章节。
💻 使用示例
基础用法
import torch
import requests
from PIL import Image
from transformers import RTDetrV2ForObjectDetection, RTDetrImageProcessor
url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)
image_processor = RTDetrImageProcessor.from_pretrained("PekingU/rtdetr_v2_r50vd")
model = RTDetrV2ForObjectDetection.from_pretrained("PekingU/rtdetr_v2_r50vd")
inputs = image_processor(images=image, return_tensors="pt")
with torch.no_grad():
outputs = model(**inputs)
results = image_processor.post_process_object_detection(outputs, target_sizes=torch.tensor([(image.height, image.width)]), threshold=0.5)
for result in results:
for score, label_id, box in zip(result["scores"], result["labels"], result["boxes"]):
score, label = score.item(), label_id.item()
box = [round(i, 2) for i in box.tolist()]
print(f"{model.config.id2label[label]}: {score:.2f} {box}")
运行结果示例
cat: 0.97 [341.14, 25.11, 639.98, 372.89]
cat: 0.96 [12.78, 56.35, 317.67, 471.34]
remote: 0.95 [39.96, 73.12, 175.65, 117.44]
sofa: 0.86 [-0.11, 2.97, 639.89, 473.62]
sofa: 0.82 [-0.12, 1.78, 639.87, 473.52]
remote: 0.79 [333.65, 76.38, 370.69, 187.48]
📚 详细文档
概述
RT-DETRv2模型由Wenyu Lv、Yian Zhao、Qinyao Chang、Kui Huang、Guanzhong Wang和Yi Liu在论文RT-DETRv2: Improved Baseline with Bag-of-Freebies for Real-Time Detection Transformer中提出。该模型在RT-DETR的基础上进行了改进,引入了选择性多尺度特征提取、离散采样算子,采用了动态数据增强和尺度自适应超参数等训练策略。这些改进在保持实时性能的同时,增强了模型的灵活性和实用性。
此模型由@jadechoghari在@cyrilvallez和@qubvel-hf的帮助下贡献。
性能表现
RT-DETRv2在所有模型尺寸上始终优于其前身,同时保持相同的实时速度。

训练情况
RT-DETRv2在COCO(Lin等人,[2014])的train2017数据集上进行训练,并在COCO val2017数据集上进行验证。报告了标准的AP指标(在IoU阈值从0.50到0.95,步长为0.05的均匀采样范围内求平均值),以及在实际场景中常用的APval50指标。
应用场景
RT-DETRv2非常适合在各种应用中进行实时目标检测,如自动驾驶、监控系统、机器人技术和零售分析。其增强的灵活性和便于部署的设计使其适用于边缘设备和大规模系统,确保在动态的现实环境中具有高精度和高速度。
🔧 技术细节
文档未提及具体技术细节,故跳过此章节。
📄 许可证
本项目采用Apache-2.0许可证。