rtdetr_v2_r18vd開源即時目標檢測模型 - 提精度保速度精準識別目標

首頁

Rtdetr V2 R18vd

由PekingU開發

RT-DETRv2是基於RT-DETR架構優化的即時目標檢測模型，通過選擇性多尺度特徵提取和訓練策略改進，在保持即時性能的同時提升檢測精度。

目標檢測

Transformers

英語開源協議:Apache-2.0 #即時目標檢測 #多尺度特徵提取 #邊緣設備適配

下載量 55.24k

發布時間 : 1/31/2025

模型概述

該模型通過創新性的架構改進和訓練策略優化，顯著提升了目標檢測的靈活性和實用性，特別適合需要即時性能的應用場景。

模型特點

選擇性多尺度特徵提取

優化特徵提取過程，提高對不同尺度目標的檢測能力

部署友好設計

採用離散採樣算子，增強模型在各種硬件平臺上的部署兼容性

訓練策略改進

引入動態數據增強和尺度自適應超參數等先進訓練技術

即時性能保持

在顯著提升精度的同時，保持了與前代模型相同的即時推理速度

模型能力

即時目標檢測

多尺度物體識別

複雜場景分析

使用案例

自動駕駛

道路物體檢測

即時檢測道路上的車輛、行人和交通標誌

高精度識別各類道路物體，支持自動駕駛決策

安防監控

可疑行為識別

即時監控場景中的人員活動和異常行為

準確識別可疑物品和行為模式

零售分析

貨架商品檢測

自動識別和統計貨架商品

提高庫存管理效率

🚀 RT-DETRv2

RT-DETRv2是一個用於即時目標檢測的模型，它通過引入選擇性多尺度特徵提取、離散採樣算子以及改進的訓練策略，在保持即時性能的同時，提升了模型的靈活性和實用性。該模型在多個模型尺寸上均優於其前身，適用於自動駕駛、監控系統等多種即時目標檢測場景。

🚀 快速開始

RT-DETRv2模型由Wenyu Lv、Yian Zhao、Qinyao Chang、Kui Huang、Guanzhong Wang和Yi Liu在論文 RT-DETRv2: Improved Baseline with Bag-of-Freebies for Real-Time Detection Transformer 中提出。該模型由 @jadechoghari 在 @cyrilvallez 和 @qubvel-hf 的幫助下貢獻。

✨ 主要特性

性能提升：RT-DETRv2在所有模型尺寸上始終優於其前身，同時保持相同的即時速度。
改進策略：引入選擇性多尺度特徵提取、離散採樣算子，以及動態數據增強和尺度自適應超參數等改進的訓練策略，增強了靈活性和實用性。

💻 使用示例

基礎用法

import torch
import requests

from PIL import Image
from transformers import RTDetrV2ForObjectDetection, RTDetrImageProcessor

url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)

image_processor = RTDetrImageProcessor.from_pretrained("PekingU/rtdetr_v2_r18vd")
model = RTDetrV2ForObjectDetection.from_pretrained("PekingU/rtdetr_v2_r18vd")

inputs = image_processor(images=image, return_tensors="pt")

with torch.no_grad():
     outputs = model(**inputs)

results = image_processor.post_process_object_detection(outputs, target_sizes=torch.tensor([(image.height, image.width)]), threshold=0.5)

for result in results:
     for score, label_id, box in zip(result["scores"], result["labels"], result["boxes"]):
         score, label = score.item(), label_id.item()
         box = [round(i, 2) for i in box.tolist()]
         print(f"{model.config.id2label[label]}: {score:.2f} {box}")

輸出示例

cat: 0.97 [341.14, 25.11, 639.98, 372.89]
cat: 0.96 [12.78, 56.35, 317.67, 471.34]
remote: 0.95 [39.96, 73.12, 175.65, 117.44]
sofa: 0.86 [-0.11, 2.97, 639.89, 473.62]
sofa: 0.82 [-0.12, 1.78, 639.87, 473.52]
remote: 0.79 [333.65, 76.38, 370.69, 187.48]