🚀 YOLOS(小尺寸)模型
YOLOS(小尺寸)模型是基於目標檢測和人臉口罩檢測的模型,它在COCO 2017目標檢測數據集上微調,還在Kaggle的人臉口罩數據集上進一步微調,能有效進行目標檢測和人臉口罩檢測。
🚀 快速開始
原始的YOLOS模型在COCO 2017目標檢測(118k帶註釋圖像)上進行了微調。它由Fang等人在論文You Only Look at One Sequence: Rethinking Transformer in Vision through Object Detection中提出,並首次在此倉庫發佈。
該模型在Kaggle的人臉口罩數據集上進一步微調。該數據集包含853張帶註釋的人物圖像,註釋類別為“戴口罩”、“未戴口罩”和“口罩佩戴不正確”。模型在單個GPU上使用Google Colab訓練了200個epoch。
✨ 主要特性
- 強大的目標檢測能力:YOLOS是使用DETR損失訓練的視覺Transformer(ViT)。儘管簡單,但基礎尺寸的YOLOS模型在COCO 2017驗證集上能夠達到42 AP(與DETR和更復雜的框架如Faster R - CNN相當)。
- 多數據集微調:在COCO 2017目標檢測數據集和人臉口罩數據集上進行微調,適用於多種目標檢測場景。
📦 安裝指南
文檔未提及安裝步驟,暫無法提供。
💻 使用示例
基礎用法
from transformers import YolosFeatureExtractor, YolosForObjectDetection
from PIL import Image
import requests
url = 'https://drive.google.com/uc?id=1VwYLbGak5c-2P5qdvfWVOeg7DTDYPbro'
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = YolosFeatureExtractor.from_pretrained('nickmuchi/yolos-small-finetuned-masks')
model = YolosForObjectDetection.from_pretrained('nickmuchi/yolos-small-finetuned-masks')
inputs = feature_extractor(images=image, return_tensors="pt")
outputs = model(**inputs)
logits = outputs.logits
bboxes = outputs.pred_boxes
目前,特徵提取器和模型都支持PyTorch。
📚 詳細文檔
預期用途與限制
你可以使用原始模型進行目標檢測。請參閱模型中心以查找所有可用的YOLOS模型。
訓練數據
YOLOS模型在ImageNet - 1k上預訓練,並在COCO 2017目標檢測上微調,該數據集分別包含118k/5k張用於訓練/驗證的帶註釋圖像。
訓練
該模型在人臉口罩數據集上微調了200個epoch。
評估結果
該模型的平均精度(AP)達到了53.2。
正在累積評估結果...
IoU指標:邊界框
指標 |
指標參數 |
位置 |
檢測數 |
值 |
平均精度 |
(AP) @[ IoU=0.50:0.95 面積= 全部 最大檢測數=100 ] |
|
|
0.273 |
平均精度 |
(AP) @[ IoU=0.50 面積= 全部 最大檢測數=100 ] |
|
|
0.532 |
平均精度 |
(AP) @[ IoU=0.75 面積= 全部 最大檢測數=100 ] |
|
|
0.257 |
平均精度 |
(AP) @[ IoU=0.50:0.95 面積= 小 最大檢測數=100 ] |
|
|
0.220 |
平均精度 |
(AP) @[ IoU=0.50:0.95 面積= 中 最大檢測數=100 ] |
|
|
0.341 |
平均精度 |
(AP) @[ IoU=0.50:0.95 面積= 大 最大檢測數=100 ] |
|
|
0.545 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面積= 全部 最大檢測數= 1 ] |
|
|
0.154 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面積= 全部 最大檢測數= 10 ] |
|
|
0.361 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面積= 全部 最大檢測數=100 ] |
|
|
0.415 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面積= 小 最大檢測數=100 ] |
|
|
0.349 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面積= 中 最大檢測數=100 ] |
|
|
0.469 |
平均召回率 |
(AR) @[ IoU=0.50:0.95 面積= 大 最大檢測數=100 ] |
|
|
0.584 |
🔧 技術細節
文檔未提供具體的技術實現細節,暫無法提供。
📄 許可證
本模型使用Apache - 2.0許可證。