O

Owlv2 Base Patch16 Ensemble

googleによって開発
OWLv2はゼロショットテキスト条件付き物体検出モデルで、テキストクエリを使用して画像内のオブジェクトを位置特定できます。
ダウンロード数 932.80k
リリース時間 : 10/13/2023

モデル概要

OWLv2はCLIPベースのオープンワールド位置特定モデルで、テキストクエリによるゼロショット物体検出をサポートし、特定カテゴリのトレーニングデータなしで画像内のオブジェクトを識別できます。

モデル特徴

ゼロショット検出
特定カテゴリのトレーニングデータが不要で、テキスト記述だけで画像内のオブジェクトを検出可能
オープン語彙
任意のテキストクエリをサポートし、事前定義されたカテゴリセットに限定されない
マルチクエリサポート
複数のテキストクエリを同時に使用して画像を検出可能

モデル能力

画像物体検出
テキスト条件付きクエリ
オープン語彙認識

使用事例

コンピュータビジョン研究
ゼロショット物体検出研究
未見カテゴリに対するモデルの検出能力を研究するために使用
学際的応用
特殊オブジェクト認識
トレーニングデータに含まれない珍しいオブジェクトを識別が必要な分野での応用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase