D

Detr Resnet 50 Dc5

由facebook開發
DETR是一個基於Transformer架構的端到端目標檢測模型,使用ResNet-50作為骨幹網絡,並在COCO數據集上訓練。
下載量 4,038
發布時間 : 3/2/2022

模型概述

該模型用於目標檢測任務,能夠識別圖像中的對象並標註其邊界框。採用Transformer編碼器-解碼器結構,結合卷積骨幹網絡,使用對象查詢機制檢測圖像中的對象。

模型特點

端到端目標檢測
無需複雜的後處理步驟(如非極大值抑制),直接輸出檢測結果。
基於Transformer架構
利用Transformer的自注意力機制處理圖像特徵,實現全局上下文理解。
對象查詢機制
使用100個對象查詢來檢測圖像中的對象,每個查詢負責尋找特定對象。
二分匹配損失
採用匈牙利算法進行預測與真實標註的匹配,優化模型訓練過程。

模型能力

目標檢測
邊界框預測
多類別識別

使用案例

計算機視覺
通用目標檢測
在自然場景圖像中檢測常見物體,如人、動物、交通工具等。
在COCO驗證集上達到43.3 AP
場景理解
分析複雜場景中的對象分佈和空間關係。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase