🚀 YOLOS (小型) モデル
このモデルは、元のYOLOSモデルをCOCO 2017物体検出データセット(118,000枚の注釈付き画像)でファインチューニングしたものです。YOLOSモデルは、Fangらによる論文 You Only Look at One Sequence: Rethinking Transformer in Vision through Object Detection で導入され、このリポジトリ で最初に公開されました。
さらに、このモデルはKaggleの ナンバープレートデータセット でファインチューニングされています。このデータセットは、「車両」と「ナンバープレート」に分類された735枚の注釈付き画像で構成されています。モデルは、Google Colabを使用して単一のGPUで200エポック訓練されました。
✨ 主な機能
モデルの説明
YOLOSは、DETR損失を使用して訓練されたVision Transformer (ViT) です。シンプルな構造であるにもかかわらず、ベースサイズのYOLOSモデルは、COCO 2017バリデーションデータセットで42 APを達成することができます(DETRやFaster R-CNNなどのより複雑なフレームワークと同等)。
想定される用途と制限
この生モデルは物体検出に使用できます。利用可能なすべてのYOLOSモデルを探すには、モデルハブ を参照してください。
📦 インストール
使い方
このモデルの使用方法は次のとおりです。
from transformers import YolosFeatureExtractor, YolosForObjectDetection
from PIL import Image
import requests
url = 'https://drive.google.com/uc?id=1p9wJIqRz3W50e2f_A0D8ftla8hoXz4T5'
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = YolosFeatureExtractor.from_pretrained('nickmuchi/yolos-small-rego-plates-detection')
model = YolosForObjectDetection.from_pretrained('nickmuchi/yolos-small-rego-plates-detection')
inputs = feature_extractor(images=image, return_tensors="pt")
outputs = model(**inputs)
logits = outputs.logits
bboxes = outputs.pred_boxes
現在、特徴抽出器とモデルの両方がPyTorchをサポートしています。
🔧 技術詳細
訓練データ
YOLOSモデルは、ImageNet-1k で事前訓練され、COCO 2017物体検出 データセットでファインチューニングされました。このデータセットは、それぞれ118,000枚と5,000枚の注釈付き画像で構成される訓練データセットとバリデーションデータセットです。
訓練
このモデルは、ナンバープレートデータセット で200エポックファインチューニングされました。
評価結果
このモデルは、平均精度 (AP) が 47.9 を達成しています。
評価結果の蓄積中...
IoUメトリック: bbox
メトリック |
メトリックパラメータ |
位置 |
検出数 |
値 |
平均精度 |
(AP) @[ IoU=0.50:0.95 |
area= all |
maxDets=100 ] |
0.479 |
平均精度 |
(AP) @[ IoU=0.50 |
area= all |
maxDets=100 ] |
0.752 |
平均精度 |
(AP) @[ IoU=0.75 |
area= all |
maxDets=100 ] |
0.555 |
平均精度 |
(AP) @[ IoU=0.50:0.95 |
area= small |
maxDets=100 ] |
0.147 |
平均精度 |
(AP) @[ IoU=0.50:0.95 |
area=medium |
maxDets=100 ] |
0.420 |
平均精度 |
(AP) @[ IoU=0.50:0.95 |
area= large |
maxDets=100 ] |
0.804 |
平均再現率 |
(AR) @[ IoU=0.50:0.95 |
area= all |
maxDets= 1 ] |
0.437 |
平均再現率 |
(AR) @[ IoU=0.50:0.95 |
area= all |
maxDets= 10 ] |
0.641 |
平均再現率 |
(AR) @[ IoU=0.50:0.95 |
area= all |
maxDets=100 ] |
0.676 |
平均再現率 |
(AR) @[ IoU=0.50:0.95 |
area= small |
maxDets=100 ] |
0.268 |
平均再現率 |
(AR) @[ IoU=0.50:0.95 |
area=medium |
maxDets=100 ] |
0.641 |
平均再現率 |
(AR) @[ IoU=0.50:0.95 |
area= large |
maxDets=100 ] |
0.870 |
📄 ライセンス
このモデルは、Apache-2.0ライセンスの下で提供されています。
属性 |
詳細 |
モデルタイプ |
YOLOS (小型) 物体検出モデル |
訓練データ |
COCO 2017物体検出データセット、ナンバープレートデータセット |
評価指標 |
平均精度、再現率、IOU |