rtdetr_v2_r34vd開源目標檢測模型 - 多尺度特徵提取，優化策略提升檢測性能

首頁

Rtdetr V2 R34vd

由PekingU開發

RT-DETRv2是即時目標檢測Transformer模型的改進版本，通過多尺度特徵提取和優化訓練策略提升性能。

目標檢測

Transformers

英語開源協議:Apache-2.0 #即時目標檢測 #多尺度特徵提取 #邊緣設備部署

下載量 886

發布時間 : 1/31/2025

模型概述

RT-DETRv2是一種即時目標檢測模型，基於Transformer架構，通過選擇性多尺度特徵提取和改進的訓練策略，在保持即時性能的同時提高了檢測精度。

模型特點

即時性能

在所有模型尺寸上均保持即時速度，適合需要快速響應的應用場景。

多尺度特徵提取

引入選擇性多尺度特徵提取，提升檢測精度和靈活性。

部署兼容性

通過離散採樣算子提升部署兼容性，適用於多種硬件平臺。

動態數據增強

採用動態數據增強和尺度自適應超參數，優化訓練效果。

模型能力

即時目標檢測

多尺度特徵提取

高精度檢測

部署兼容性

使用案例

自動駕駛

車輛和行人檢測

即時檢測道路上的車輛和行人，提升自動駕駛系統的安全性。

高精度檢測，即時響應。

監控系統

異常行為檢測

即時監控視頻流，檢測異常行為或可疑物體。

快速響應，高精度識別。

機器人技術

物體抓取

機器人通過即時目標檢測識別並抓取特定物體。

高精度定位，即時操作。

零售分析

商品識別

即時識別貨架上的商品，用於庫存管理和顧客行為分析。

高精度識別，快速響應。

🚀 RT-DETRv2

RT-DETRv2是一個用於目標檢測的模型，它在RT-DETR的基礎上進行了改進，提升了靈活性和實用性，同時保持了即時性能，可廣泛應用於自動駕駛、監控系統等多個領域。

🚀 快速開始

本部分將介紹如何快速使用RT-DETRv2進行目標檢測。

import torch
import requests

from PIL import Image
from transformers import RTDetrV2ForObjectDetection, RTDetrImageProcessor

url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)

image_processor = RTDetrImageProcessor.from_pretrained("PekingU/rtdetr_v2_r34vd")
model = RTDetrV2ForObjectDetection.from_pretrained("PekingU/rtdetr_v2_r34vd")

inputs = image_processor(images=image, return_tensors="pt")

with torch.no_grad():
     outputs = model(**inputs)

results = image_processor.post_process_object_detection(outputs, target_sizes=torch.tensor([(image.height, image.width)]), threshold=0.5)

for result in results:
     for score, label_id, box in zip(result["scores"], result["labels"], result["boxes"]):
         score, label = score.item(), label_id.item()
         box = [round(i, 2) for i in box.tolist()]
         print(f"{model.config.id2label[label]}: {score:.2f} {box}")

運行上述代碼後，將得到如下輸出示例：

cat: 0.97 [341.14, 25.11, 639.98, 372.89]
cat: 0.96 [12.78, 56.35, 317.67, 471.34]
remote: 0.95 [39.96, 73.12, 175.65, 117.44]
sofa: 0.86 [-0.11, 2.97, 639.89, 473.62]
sofa: 0.82 [-0.12, 1.78, 639.87, 473.52]
remote: 0.79 [333.65, 76.38, 370.69, 187.48]

✨ 主要特性

模型改進

RT-DETRv2由Wenyu Lv、Yian Zhao、Qinyao Chang、Kui Huang、Guanzhong Wang和Yi Liu在論文RT-DETRv2: Improved Baseline with Bag-of-Freebies for Real-Time Detection Transformer中提出。它通過引入選擇性多尺度特徵提取、離散採樣算子，以及改進動態數據增強和尺度自適應超參數等訓練策略，對RT-DETR進行了優化。這些改進在保持即時性能的同時，提高了模型的靈活性和實用性。