🚀 YOLOS (小型) モデル
このモデルは、Roboflowのライセンスプレート認識データセット(トレーニングセットに5200枚、検証セットに380枚の画像が含まれる)でhustvl/yolos-smallをファインチューニングしたバージョンです。元のYOLOSモデルは、COCO 2017物体検出(118k枚の注釈付き画像)でファインチューニングされています。
🚀 クイックスタート
このモデルは物体検出に使用できます。利用可能なすべてのYOLOSモデルを探すには、モデルハブを参照してください。
✨ 主な機能
YOLOSは、DETR損失を使用してトレーニングされたVision Transformer (ViT) です。シンプルな構造であるにもかかわらず、ベースサイズのYOLOSモデルはCOCO 2017検証セットで42 APを達成することができます(DETRやFaster R-CNNなどのより複雑なフレームワークと同等)。
📦 インストール
このモデルを使用するには、必要なライブラリをインストールする必要があります。以下のコマンドを使用してください。
pip install transformers requests pillow
💻 使用例
基本的な使用法
from transformers import YolosFeatureExtractor, YolosForObjectDetection
from PIL import Image
import requests
url = 'https://drive.google.com/uc?id=1p9wJIqRz3W50e2f_A0D8ftla8hoXz4T5'
image = Image.open(requests.get(url, stream=True).raw)
feature_extractor = YolosFeatureExtractor.from_pretrained('nickmuchi/yolos-small-finetuned-license-plate-detection')
model = YolosForObjectDetection.from_pretrained('nickmuchi/yolos-small-finetuned-license-plate-detection')
inputs = feature_extractor(images=image, return_tensors="pt")
outputs = model(**inputs)
logits = outputs.logits
bboxes = outputs.pred_boxes
現在、特徴抽出器とモデルの両方がPyTorchをサポートしています。
📚 ドキュメント
モデルの説明
YOLOSは、DETR損失を使用してトレーニングされたVision Transformer (ViT) です。シンプルな構造であるにもかかわらず、ベースサイズのYOLOSモデルはCOCO 2017検証セットで42 APを達成することができます(DETRやFaster R-CNNなどのより複雑なフレームワークと同等)。
想定される用途と制限
このモデルは物体検出に使用できます。利用可能なすべてのYOLOSモデルを探すには、モデルハブを参照してください。
トレーニングデータ
YOLOSモデルは、ImageNet-1kで事前トレーニングされ、COCO 2017物体検出データセット(トレーニングに118k枚、検証に5k枚の注釈付き画像)でファインチューニングされています。
トレーニング
このモデルは、ライセンスプレート認識データセットで200エポックファインチューニングされています。
評価結果
このモデルは、平均精度 (AP) で49.0を達成しています。
評価結果の蓄積中...
IoUメトリック: bbox
メトリック |
メトリックパラメータ |
位置 |
検出数 |
値 |
平均精度 (AP) @[ IoU=0.50:0.95 |
area= all |
maxDets=100 ] |
0.490 |
|
平均精度 (AP) @[ IoU=0.50 |
area= all |
maxDets=100 ] |
0.792 |
|
平均精度 (AP) @[ IoU=0.75 |
area= all |
maxDets=100 ] |
0.585 |
|
平均精度 (AP) @[ IoU=0.50:0.95 |
area= small |
maxDets=100 ] |
0.167 |
|
平均精度 (AP) @[ IoU=0.50:0.95 |
area= medium |
maxDets=100 ] |
0.460 |
|
平均精度 (AP) @[ IoU=0.50:0.95 |
area= large |
maxDets=100 ] |
0.824 |
|
平均再現率 (AR) @[ IoU=0.50:0.95 |
area= all |
maxDets= 1 ] |
0.447 |
|
平均再現率 (AR) @[ IoU=0.50:0.95 |
area= all |
maxDets= 10 ] |
0.671 |
|
平均再現率 (AR) @[ IoU=0.50:0.95 |
area= all |
maxDets=100 ] |
0.676 |
|
平均再現率 (AR) @[ IoU=0.50:0.95 |
area= small |
maxDets=100 ] |
0.278 |
|
平均再現率 (AR) @[ IoU=0.50:0.95 |
area= medium |
maxDets=100 ] |
0.641 |
|
平均再現率 (AR) @[ IoU=0.50:0.95 |
area= large |
maxDets=100 ] |
0.890 |
|
🔧 技術詳細
- モデルタイプ:YOLOS(小型)
- トレーニングデータ:Roboflowのライセンスプレート認識データセット、COCO 2017物体検出データセット、ImageNet-1k
- 評価指標:平均精度 (AP)、再現率 (AR)、IoU