D

Detr Resnet 50 Panoptic

facebookによって開発
DETRはTransformerアーキテクチャに基づくエンドツーエンド物体検出モデルで、ResNet-50をバックボーンとして使用し、COCOデータセットで訓練され、物体検出とパノプティックセグメンテーションタスクをサポートします。
ダウンロード数 9,586
リリース時間 : 3/2/2022

モデル概要

DEtection TRansformer (DETR) はCOCO 2017パノプティックデータセットで訓練されたエンドツーエンドモデルで、エンコーダ-デコーダTransformerアーキテクチャを採用し、畳み込みバックボーンネットワークと組み合わせ、オブジェクトクエリメカニズムにより物体検出とセグメンテーションを実現します。

モデル特徴

エンドツーエンド物体検出
従来の物体検出モデルで必要なアンカーボックスや非極大値抑制(NMS)などの複雑な後処理ステップが不要で、直接検出結果を出力します。
Transformerアーキテクチャ
エンコーダ-デコーダTransformer構造を採用し、自己注意メカニズムによりグローバルなコンテキスト情報を処理します。
オブジェクトクエリメカニズム
100個の固定されたオブジェクトクエリを使用して画像内の対象を予測し、各クエリは特定のオブジェクトに対応します。
ハンガリアン損失
ハンガリアンアルゴリズムを使用して予測と真のアノテーション間の最適な1対1マッピングを確立し、モデルの訓練を最適化します。

モデル能力

物体検出
パノプティックセグメンテーション
画像解析

使用事例

コンピュータビジョン
スポーツイベント分析
サッカー試合中の選手、ボール、フィールド要素の検出とセグメンテーション
動物認識
画像内の異なる動物種の識別とセグメンテーション
シーン理解
建設現場などの複雑なシーンにおける様々な物体の分析
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase