R

Rtdetr R18vd Coco O365

PekingUによって開発
初のリアルタイムエンドツーエンド物体検出器、ハイブリッドエンコーダとクエリ選択メカニズムによりNMS不要の効率的な検出を実現
ダウンロード数 952
リリース時間 : 5/21/2024

モデル概要

RT-DETRはトランスフォーマーを基にしたリアルタイム物体検出モデルで、非極大抑制(NMS)を排除することで精度を維持しつつ検出速度を大幅に向上。デコーダ層数の調整による柔軟な速度制御をサポート。

モデル特徴

NMSフリー設計
エンドツーエンドトランスフォーマーアーキテクチャにより従来の物体検出における非極大抑制を排除、計算コストを削減
ハイブリッドエンコーダ
注意機構を用いたスケール内相互作用(AIFI)とCNNのクロススケール融合(CCFF)を組み合わせ、マルチスケール特徴を効率的に処理
動的速度調整
デコーダ層数の調整により異なる推論速度を実現、再トレーニング不要で多様なシナリオに対応
クエリ選択メカニズム
最小不確実性クエリ選択によりデコーダに高品質な初期クエリを提供、検出精度を向上

モデル能力

リアルタイム物体検出
マルチスケール物体認識
エンドツーエンドバウンディングボックス予測

使用事例

インテリジェント監視
公共空間の人流分析
空港、駅などのシナリオにおける群衆密度と移動軌跡をリアルタイム検出
108FPS@53.1AP (R50モデル)
自動運転
道路物体検出
車両、歩行者、交通標識などの道路要素を識別
異なる速度レベル設定をサポート(74-217FPS)
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase