D

Detr Resnet 50

facebookによって開発
DETRはTransformerアーキテクチャに基づくエンドツーエンド物体検出モデルで、ResNet-50をバックボーンとして使用し、COCOデータセットでトレーニングされています。
ダウンロード数 505.27k
リリース時間 : 3/2/2022

モデル概要

このモデルはエンコーダー-デコーダーTransformer構造を採用し、畳み込みバックボーンネットワークと組み合わせ、オブジェクトクエリメカニズムにより物体検出を実現し、従来のアンカーボックス設計を必要としません。

モデル特徴

エンドツーエンドトレーニング
複雑な手動設計コンポーネント(アンカーボックスなど)を必要とせず、直接検出結果を出力
Transformerアーキテクチャ
自己注意メカニズムを利用してグローバルコンテキスト情報を処理し、検出精度を向上
ハンガリアン損失
ハンガリアンアルゴリズムを使用して予測とアノテーションの最適マッチングを行い、トレーニングプロセスを最適化

モデル能力

画像物体検出
マルチクラス認識
バウンディングボックス予測

使用事例

シーン理解
監視カメラ映像分析
監視画面内の歩行者や車両などの物体をリアルタイム検出
自動運転
道路環境中の交通標識、歩行者、他の車両を識別
コンテンツ管理
画像自動タグ付け
画像ライブラリの内容に対して構造化タグと位置情報を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase