Y

Yolos Small

Developed by hustvl
基於視覺Transformer(ViT)的目標檢測模型,使用DETR損失函數訓練,在COCO數據集上表現優異。
Downloads 154.46k
Release Time : 4/26/2022

Model Overview

YOLOS是一種簡潔高效的視覺Transformer模型,專為目標檢測任務設計。它採用DETR風格的二分匹配損失進行訓練,在COCO數據集上達到與DETR和Faster R-CNN相當的檢測精度。

Model Features

Transformer架構
採用純視覺Transformer結構,無需傳統CNN組件即可實現高效目標檢測
二分匹配損失
使用匈牙利算法進行預測與標註的最優匹配,結合交叉熵和邊界框損失進行端到端訓練
簡潔設計
結構簡單但性能強大,基礎尺寸模型在COCO上達到42 AP

Model Capabilities

圖像中的多目標檢測
邊界框預測
物體分類

Use Cases

場景理解
監控視頻分析
即時檢測監控畫面中的行人、車輛等目標
自動駕駛感知
識別道路環境中的交通參與者與障礙物
內容分析
圖像內容審核
檢測圖像中的特定物體或敏感內容
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase