🚀 DETR (End-to-End Object Detection) モデル(ResNet-50バックボーン、チェス駒でファインチューニング済み)
このモデルは、チェス駒の認識データセットでエンドツーエンドにトレーニングされたDetection Transformer (DETR) モデルです。DETRモデルは、畳み込みバックボーンを持つエンコーダ・デコーダ型のトランスフォーマーで、物体検出を行うためにデコーダ出力の上に2つのヘッドが追加されています。
🚀 クイックスタート
このモデルを使用するには、以下のコードを参考にしてください。
from transformers import DetrImageProcessor, DetrForObjectDetection
import torch
from PIL import Image
import requests
url = "http://images.cocodataset.org/val2017/000000039769.jpg"
image = Image.open(requests.get(url, stream=True).raw)
processor = DetrImageProcessor.from_pretrained("aesat/detr-finetuned-chess", revision="no_timm")
model = DetrForObjectDetection.from_pretrained("facebook/detr-finetuned-chess", revision="no_timm")
inputs = processor(images=image, return_tensors="pt")
outputs = model(**inputs)
target_sizes = torch.tensor([image.size[::-1]])
results = processor.post_process_object_detection(outputs, target_sizes=target_sizes, threshold=0.9)[0]
for score, label, box in zip(results["scores"], results["labels"], results["boxes"]):
box = [round(i, 2) for i in box.tolist()]
print(
f"Detected {model.config.id2label[label.item()]} with confidence "
f"{round(score.item(), 3)} at location {box}"
)
📚 ドキュメント
モデルの詳細
モデルの説明
DETRモデルは、畳み込みバックボーンを持つエンコーダ・デコーダ型のトランスフォーマーです。物体検出を行うために、デコーダ出力の上に2つのヘッドが追加されています。クラスラベル用の線形層と、バウンディングボックス用のMLP(多層パーセプトロン)です。このモデルは、いわゆる物体クエリを使用して画像内の物体を検出します。各物体クエリは、画像内の特定の物体を探します。COCOの場合、物体クエリの数は100に設定されています。
- 開発者: [詳細情報が必要]
- 資金提供元 [オプション]: [詳細情報が必要]
- 共有元 [オプション]: [詳細情報が必要]
- モデルの種類: [詳細情報が必要]
- 言語 (NLP): [詳細情報が必要]
- ライセンス: [詳細情報が必要]
- ファインチューニング元のモデル [オプション]: [詳細情報が必要]
モデルのソース [オプション]
- リポジトリ: [詳細情報が必要]
- 論文 [オプション]: [詳細情報が必要]
- デモ [オプション]: [詳細情報が必要]
使用方法
モデルの使用方法(ファインチューニングや大規模なエコシステム/アプリへの組み込みなし)
コード例は「クイックスタート」のセクションを参照してください。
下流での使用 [オプション]
[詳細情報が必要]
想定外の使用
[詳細情報が必要]
バイアス、リスク、制限事項
推奨事項
ユーザー(直接的なユーザーと下流のユーザーの両方)は、このモデルのリスク、バイアス、制限事項を認識する必要があります。さらなる推奨事項については、詳細情報が必要です。
モデルの使い始め方
モデルを使い始めるには、「クイックスタート」のコードを使用してください。
トレーニングの詳細
トレーニングデータ
[詳細情報が必要]
トレーニング手順
前処理 [オプション]
[詳細情報が必要]
トレーニングハイパーパラメータ
速度、サイズ、時間 [オプション]
[詳細情報が必要]
評価
テストデータ、要因、メトリクス
テストデータ
[詳細情報が必要]
要因
[詳細情報が必要]
メトリクス
[詳細情報が必要]
結果
[詳細情報が必要]
要約
モデルの検査 [オプション]
[詳細情報が必要]
環境への影響
総排出量(CO2当量グラム)や電力使用量などの追加的な考慮事項は、Lacoste et al. (2019) に提示されている Machine Learning Impact calculator を使用して推定できます。
- ハードウェアの種類: [詳細情報が必要]
- 使用時間: [詳細情報が必要]
- クラウドプロバイダー: [詳細情報が必要]
- コンピュートリージョン: [詳細情報が必要]
- 排出された二酸化炭素量: [詳細情報が必要]
技術仕様 [オプション]
モデルのアーキテクチャと目的
[詳細情報が必要]
コンピュートインフラストラクチャ
ハードウェア
[詳細情報が必要]
ソフトウェア
[詳細情報が必要]
引用 [オプション]
BibTeX
[詳細情報が必要]
APA
[詳細情報が必要]
用語集 [オプション]
[詳細情報が必要]
詳細情報 [オプション]
[詳細情報が必要]
モデルカードの作成者 [オプション]
[詳細情報が必要]
モデルカードの連絡先
[詳細情報が必要]
📄 ライセンス
このモデルは apache-2.0
ライセンスの下で提供されています。