O

Owlv2 Base Patch16 Finetuned

googleによって開発
OWLv2はゼロショットテキスト条件付き物体検出モデルで、テキストクエリを使用して画像内のオブジェクトを検索できます。
ダウンロード数 2,698
リリース時間 : 10/13/2023

モデル概要

OWLv2はCLIPバックボーンネットワークに基づくオープンワールドローカライゼーションモデルで、特定のカテゴリのトレーニングデータなしでテキストクエリによって画像内のオブジェクトを検出できます。

モデル特徴

ゼロショット検出能力
特定カテゴリのトレーニングデータが不要で、テキストクエリを通じて直接新しいカテゴリのオブジェクトを検出可能
オープン語彙認識
トレーニングデータに存在しないカテゴリ名を認識可能
マルチクエリ検出
複数のテキストクエリを同時使用したオブジェクト検出をサポート

モデル能力

画像内の物体検出
テキスト条件付き物体位置特定
オープン語彙認識
ゼロショット学習

使用事例

コンピュータビジョン研究
ゼロショット物体検出研究
未見カテゴリに対するモデルの検出能力を研究するために使用
学際的応用
専門分野の物体認識
医療、農業などの専門分野でトレーニングデータに稀なオブジェクトを認識
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase