D

Detr Resnet 50 Panoptic

由facebook開發
DETR是基於Transformer架構的端到端目標檢測模型,採用ResNet-50作為骨幹網絡,在COCO數據集上訓練,支持目標檢測和全景分割任務。
下載量 9,586
發布時間 : 3/2/2022

模型概述

DEtection TRansformer (DETR) 是一個基於COCO 2017全景數據集訓練的端到端模型,採用編碼器-解碼器Transformer架構,結合卷積骨幹網絡,通過對象查詢機制實現目標檢測和分割。

模型特點

端到端目標檢測
無需傳統目標檢測模型中的錨框和非極大值抑制(NMS)等複雜後處理步驟,直接輸出檢測結果。
Transformer架構
採用編碼器-解碼器Transformer結構,利用自注意力機制處理全局上下文信息。
對象查詢機制
通過100個固定的對象查詢預測圖像中的目標,每個查詢對應一個特定對象。
二分匹配損失
使用匈牙利算法建立預測與真實標註間的最優一對一映射,優化模型訓練。

模型能力

目標檢測
全景分割
圖像分析

使用案例

計算機視覺
體育賽事分析
檢測和分割足球比賽中的球員、球和場地元素
動物識別
識別和分割圖像中的不同動物種類
場景理解
分析建築工地等複雜場景中的各類物體
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase