O

Owlv2 Large Patch14

由google開發
OWLv2是一個零樣本文本條件目標檢測模型,可通過文本查詢在圖像中檢測對象,無需特定類別的訓練數據。
下載量 3,679
發布時間 : 10/13/2023

模型概述

OWLv2是基於CLIP的開放詞彙目標檢測模型,使用ViT-L/14作為視覺編碼器,能夠通過自然語言描述檢測圖像中的對象。

模型特點

零樣本檢測能力
無需特定類別的訓練數據,僅通過文本描述即可檢測新類別對象
開放詞彙理解
能夠理解並檢測訓練數據中未出現的對象類別
多查詢檢測
支持同時使用多個文本查詢進行對象檢測

模型能力

圖像中的對象檢測
文本條件目標定位
開放詞彙識別
多類別同時檢測

使用案例

計算機視覺研究
零樣本目標檢測研究
研究模型在未見類別上的檢測能力
工業應用
庫存管理
通過自然語言描述檢測倉庫中的物品
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase