Y

Yolos Tiny

hustvlによって開発
COCO 2017物体検出データセットでファインチューニングされたYOLOSモデル、Vision Transformerアーキテクチャを使用した効率的な物体検出を実現。
ダウンロード数 144.58k
リリース時間 : 4/26/2022

モデル概要

YOLOSはDETR損失でトレーニングされたVision Transformer(ViT)で、物体検出タスク専用に設計され、シンプルな構造ながら優れた性能を発揮。

モデル特徴

シンプルなTransformerアーキテクチャ
Vision Transformerアーキテクチャを採用し、複雑な設計なしで効率的な物体検出を実現。
ハンガリアン損失
ハンガリアンマッチングアルゴリズムを使用してクエリとアノテーション間の最適な1対1マッピングを確立し、モデルパラメータを最適化。
高性能
基本サイズのモデルはCOCO検証セットで42 APを達成、DETRやFaster R-CNNなどの複雑なフレームワークと同等の性能。

モデル能力

物体検出
画像分析
物体認識

使用事例

視覚検出
シーン物体検出
画像内の様々な物体を検出、例としてサバンナの動物やサッカー試合の選手など。
画像内の複数の物体を正確に識別・位置特定可能。
工業品質検査
生産ライン上の製品欠陥や異常を検出。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase