rtdetr_v2_r34vd开源目标检测模型 - 多尺度特征提取，优化策略提升检测性能

首页

Rtdetr V2 R34vd

由 PekingU 开发

RT-DETRv2是实时目标检测Transformer模型的改进版本，通过多尺度特征提取和优化训练策略提升性能。

目标检测

Transformers

英语开源协议:Apache-2.0 #实时目标检测 #多尺度特征提取 #边缘设备部署

下载量 886

发布时间 : 1/31/2025

模型简介

RT-DETRv2是一种实时目标检测模型，基于Transformer架构，通过选择性多尺度特征提取和改进的训练策略，在保持实时性能的同时提高了检测精度。

模型特点

实时性能

在所有模型尺寸上均保持实时速度，适合需要快速响应的应用场景。

多尺度特征提取

引入选择性多尺度特征提取，提升检测精度和灵活性。

部署兼容性

通过离散采样算子提升部署兼容性，适用于多种硬件平台。

动态数据增强

采用动态数据增强和尺度自适应超参数，优化训练效果。

模型能力

实时目标检测

多尺度特征提取

高精度检测

部署兼容性

使用案例

自动驾驶

车辆和行人检测

实时检测道路上的车辆和行人，提升自动驾驶系统的安全性。

高精度检测，实时响应。

监控系统

异常行为检测

实时监控视频流，检测异常行为或可疑物体。

快速响应，高精度识别。

机器人技术

物体抓取

机器人通过实时目标检测识别并抓取特定物体。

高精度定位，实时操作。

零售分析

商品识别

实时识别货架上的商品，用于库存管理和顾客行为分析。

高精度识别，快速响应。

🚀 RT-DETRv2

RT-DETRv2是一个用于目标检测的模型，它在RT-DETR的基础上进行了改进，提升了灵活性和实用性，同时保持了实时性能，可广泛应用于自动驾驶、监控系统等多个领域。

🚀 快速开始

本部分将介绍如何快速使用RT-DETRv2进行目标检测。

import torch
import requests

from PIL import Image
from transformers import RTDetrV2ForObjectDetection, RTDetrImageProcessor

url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)

image_processor = RTDetrImageProcessor.from_pretrained("PekingU/rtdetr_v2_r34vd")
model = RTDetrV2ForObjectDetection.from_pretrained("PekingU/rtdetr_v2_r34vd")

inputs = image_processor(images=image, return_tensors="pt")

with torch.no_grad():
     outputs = model(**inputs)

results = image_processor.post_process_object_detection(outputs, target_sizes=torch.tensor([(image.height, image.width)]), threshold=0.5)

for result in results:
     for score, label_id, box in zip(result["scores"], result["labels"], result["boxes"]):
         score, label = score.item(), label_id.item()
         box = [round(i, 2) for i in box.tolist()]
         print(f"{model.config.id2label[label]}: {score:.2f} {box}")

运行上述代码后，将得到如下输出示例：

cat: 0.97 [341.14, 25.11, 639.98, 372.89]
cat: 0.96 [12.78, 56.35, 317.67, 471.34]
remote: 0.95 [39.96, 73.12, 175.65, 117.44]
sofa: 0.86 [-0.11, 2.97, 639.89, 473.62]
sofa: 0.82 [-0.12, 1.78, 639.87, 473.52]
remote: 0.79 [333.65, 76.38, 370.69, 187.48]

✨ 主要特性

模型改进

RT-DETRv2由Wenyu Lv、Yian Zhao、Qinyao Chang、Kui Huang、Guanzhong Wang和Yi Liu在论文RT-DETRv2: Improved Baseline with Bag-of-Freebies for Real-Time Detection Transformer中提出。它通过引入选择性多尺度特征提取、离散采样算子，以及改进动态数据增强和尺度自适应超参数等训练策略，对RT-DETR进行了优化。这些改进在保持实时性能的同时，提高了模型的灵活性和实用性。