O

Owlv2 Large Patch14 Ensemble

Thomasboosingerによって開発
OWLv2はゼロショットのテキスト条件付き物体検出モデルで、テキストクエリを使用して画像内のオブジェクトを検出できます。
ダウンロード数 1
リリース時間 : 2/19/2024

モデル概要

OWLv2はCLIPバックボーンに基づくオープン語彙物体検出モデルで、トレーニングで見たことのないオブジェクトカテゴリをテキストクエリで検出できます。

モデル特徴

ゼロショット検出能力
特定カテゴリのトレーニングデータが不要で、テキスト記述だけで新しいカテゴリのオブジェクトを検出可能
オープン語彙
定義済みカテゴリセットに限定されず、任意のテキストクエリを検出カテゴリとしてサポート
マルチモーダルアーキテクチャ
視覚と言語モデルを統合し、画像とテキストの共同理解を実現

モデル能力

ゼロショット物体検出
画像理解
テキスト条件付き視覚検索
複数オブジェクト検出

使用事例

コンピュータビジョン研究
ゼロショット検出研究
未知カテゴリに対するモデルの汎化能力を研究するために使用
学際的応用
特殊オブジェクト認識
医療、農業などの分野でトレーニングデータに稀な特殊オブジェクトを識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase