D

Deformable Detr Box Supervised

facebookによって開発
Deformable DETRはTransformerアーキテクチャに基づく物体検出モデルで、LVISデータセットでトレーニングされ、1203クラスの物体検出をサポートします。
ダウンロード数 193
リリース時間 : 2/27/2023

モデル概要

このモデルはDeformable DETRアーキテクチャを採用し、畳み込みバックボーンネットワークとTransformerエンコーダー・デコーダーを組み合わせ、オブジェクトクエリメカニズムによって効率的な物体検出を実現します。

モデル特徴

大規模クラス検出
LVISデータセットの1203物体クラス検出をサポートし、希少クラスも含みます。
効率的なTransformerアーキテクチャ
Deformable DETRアーキテクチャを採用し、変形可能な注意メカニズムによって計算効率を向上させます。
エンドツーエンド学習
複雑な後処理なしで直接検出結果を出力します。

モデル能力

多クラス物体検出
バウンディングボックス予測
大規模視覚認識

使用事例

汎用物体検出
シーン理解
複雑なシーン内の多様な物体を検出
LVISデータセットで31.7 mAPを達成
希少物体検出
一般的でない物体クラスを識別
希少クラスmAPは21.4
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase