D

Detr Resnet 50 Dc5

facebookによって開発
DETRはTransformerアーキテクチャに基づくエンドツーエンド物体検出モデルで、ResNet - 50をバックボーンネットワークとして使用し、COCOデータセットで訓練されています。
ダウンロード数 4,038
リリース時間 : 3/2/2022

モデル概要

このモデルは物体検出タスクに使用され、画像内の物体を識別してそのバウンディングボックスを标注することができます。Transformerエンコーダ - デコーダ構造を採用し、畳み込みバックボーンネットワークと組み合わせ、物体クエリメカニズムを使用して画像内の物体を検出します。

モデル特徴

エンドツーエンド物体検出
複雑な後処理ステップ(非最大値抑制など)を必要とせず、直接検出結果を出力します。
Transformerアーキテクチャベース
Transformerの自己注意機構を利用して画像特徴を処理し、グローバルなコンテキスト理解を実現します。
物体クエリメカニズム
100個の物体クエリを使用して画像内の物体を検出し、各クエリは特定の物体を探す役割を担います。
二分マッチング損失
ハンガリアンアルゴリズムを使用して予測と真の标注をマッチングさせ、モデルの訓練プロセスを最適化します。

モデル能力

物体検出
バウンディングボックス予測
多クラス識別

使用事例

コンピュータビジョン
汎用物体検出
自然シーン画像内の人、動物、交通手段などの一般的な物体を検出します。
COCO検証セットで43.3 APに達します
シーン理解
複雑なシーン内の物体の分布と空間関係を分析します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase