Y

Yolos Small

由 hustvl 开发
基于视觉Transformer(ViT)的目标检测模型,使用DETR损失函数训练,在COCO数据集上表现优异。
下载量 154.46k
发布时间 : 4/26/2022

模型简介

YOLOS是一种简洁高效的视觉Transformer模型,专为目标检测任务设计。它采用DETR风格的二分匹配损失进行训练,在COCO数据集上达到与DETR和Faster R-CNN相当的检测精度。

模型特点

Transformer架构
采用纯视觉Transformer结构,无需传统CNN组件即可实现高效目标检测
二分匹配损失
使用匈牙利算法进行预测与标注的最优匹配,结合交叉熵和边界框损失进行端到端训练
简洁设计
结构简单但性能强大,基础尺寸模型在COCO上达到42 AP

模型能力

图像中的多目标检测
边界框预测
物体分类

使用案例

场景理解
监控视频分析
实时检测监控画面中的行人、车辆等目标
自动驾驶感知
识别道路环境中的交通参与者与障碍物
内容分析
图像内容审核
检测图像中的特定物体或敏感内容
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase