Y

Yolos Small Balloon

zohebによって開発
YOLOSは視覚Transformer(ViT)アーキテクチャを使用した物体検出モデルで、DETR損失でトレーニングされ、COCOとMatterportバルーンデータセットでファインチューニングされています。
ダウンロード数 101
リリース時間 : 10/16/2022

モデル概要

このモデルはTransformerアーキテクチャを採用した物体検出モデルで、二分マッチング損失でトレーニングされ、PyTorchフレームワークをサポートし、小規模な物体検出タスクに適しています。

モデル特徴

Transformerアーキテクチャ
視覚Transformerアーキテクチャを採用し、画像をシーケンスデータとして処理して物体検出を行います。
二分マッチング損失
ハンガリアンマッチングアルゴリズムを使用して予測とアノテーション間の最適なマッピングを確立し、クロスエントロピーとバウンディングボックス損失でモデルを最適化します。
小規模データセットのファインチューニング
Matterportバルーンデータセット(わずか74枚の画像)で成功裏にファインチューニングされ、小規模データセットへの適応能力を示しています。

モデル能力

物体検出
バウンディングボックス予測
小規模データ適応

使用事例

コンピュータビジョン
バルーン検出
画像内のバルーンオブジェクトを検出し、その位置をマークします
Matterportバルーン検証セットで26.9 APを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase