dfine-medium-obj365開源即時目標檢測模型 - 精準定位物體，助力快速識別！

首頁

Dfine Medium Obj365

由ustc-community開發

D-FINE是一個強大的即時目標檢測模型，通過重新定義DETR模型中的邊界框迴歸任務，實現了出色的定位精度。

目標檢測

Transformers

英語開源協議:Apache-2.0 #即時目標檢測 #高精度定位 #自動駕駛優化

下載量 3,655

發布時間 : 3/28/2025

模型概述

D-FINE是一款基於DETR架構的即時目標檢測器，通過細粒度分佈細化（FDR）和全局最優定位自蒸餾（GO-LSD）兩大關鍵技術，顯著提升了目標檢測的定位精度。適用於自動駕駛、監控系統等多個領域。

模型特點

細粒度分佈細化（FDR）

重新定義邊界框迴歸任務為細粒度分佈細化過程，顯著提升定位精度

全局最優定位自蒸餾（GO-LSD）

通過自蒸餾技術實現全局最優定位，增強模型性能

即時檢測能力

優化後的架構支持即時目標檢測，適合動態環境應用

模型能力

即時目標檢測

高精度定位

多類別物體識別

使用案例

自動駕駛

道路物體檢測

即時檢測道路上的車輛、行人等物體

高精度定位支持安全駕駛決策

智能監控

安防監控

即時檢測監控畫面中的異常物體或行為

提升監控系統響應速度

零售分析

貨架商品檢測

自動識別貨架商品擺放情況

優化庫存管理和商品陳列

🚀 D-FINE

D-FINE是一個強大的即時目標檢測模型，通過重新定義DETR模型中的邊界框迴歸任務，實現了出色的定位精度。它可用於自動駕駛、監控系統等多個領域。

🚀 快速開始

模型簡介

D-FINE模型由Yansong Peng、Hebei Li、Peixi Wu、Yueyi Zhang、Xiaoyan Sun和Feng Wu在論文D-FINE: Redefine Regression Task in DETRs as Fine-grained Distribution Refinement中提出。該模型由VladOS95-cyber在@qubvel-hf的幫助下貢獻，是D-FINE在HF transformers庫中的實現。

coco：在COCO數據集上訓練的模型
obj365：在Object365數據集上訓練的模型
obj2coco：先在Object365數據集上訓練，再在COCO數據集上微調的模型

性能表現

D-FINE是一款強大的即時目標檢測器，通過重新定義DETR模型中的邊界框迴歸任務，實現了出色的定位精度。它主要包含兩個關鍵組件：細粒度分佈細化（FDR）和全局最優定位自蒸餾（GO-LSD）。

訓練情況

D-FINE在COCO和Objects365（Lin等人 [2014]）的train2017數據集上進行訓練，並在COCO + Objects365的val2017數據集上進行驗證。我們報告了標準的AP指標（在從0.50 - 0.95的均勻採樣IoU閾值上平均，步長為0.05），以及在實際場景中常用的APval5000指標。

應用場景

D-FINE非常適合在各種應用中進行即時目標檢測，如自動駕駛、監控系統、機器人技術和零售分析。其增強的靈活性和便於部署的設計，使其既適用於邊緣設備，也適用於大規模系統，同時確保在動態的現實環境中具有高精度和高速度。

💻 使用示例

基礎用法

import torch
import requests

from PIL import Image
from transformers import DFineForObjectDetection, AutoImageProcessor

url = 'http://images.cocodataset.org/val2017/000000039769.jpg'
image = Image.open(requests.get(url, stream=True).raw)

image_processor = AutoImageProcessor.from_pretrained("ustc-community/dfine-medium-obj365")
model = DFineForObjectDetection.from_pretrained("ustc-community/dfine-medium-obj365")

inputs = image_processor(images=image, return_tensors="pt")

with torch.no_grad():
    outputs = model(**inputs)

results = image_processor.post_process_object_detection(outputs, target_sizes=torch.tensor([image.size[::-1]]), threshold=0.3)

for result in results:
    for score, label_id, box in zip(result["scores"], result["labels"], result["boxes"]):
        score, label = score.item(), label_id.item()
        box = [round(i, 2) for i in box.tolist()]
        print(f"{model.config.id2label[label]}: {score:.2f} {box}")