O

Owlv2 Base Patch16 Ensemble

由google開發
OWLv2是一種零樣本文本條件目標檢測模型,可通過文本查詢在圖像中定位對象。
下載量 932.80k
發布時間 : 10/13/2023

模型概述

OWLv2是基於CLIP的開放世界定位模型,支持通過文本查詢進行零樣本目標檢測,無需特定類別的訓練數據即可識別圖像中的對象。

模型特點

零樣本檢測
無需特定類別的訓練數據,僅通過文本描述即可檢測圖像中的對象
開放詞彙
支持任意文本查詢,不限於預定義的類別集合
多查詢支持
可同時使用多個文本查詢對圖像進行檢測

模型能力

圖像目標檢測
文本條件查詢
開放詞彙識別

使用案例

計算機視覺研究
零樣本目標檢測研究
用於研究模型在未見類別上的檢測能力
跨學科應用
特殊對象識別
在需要識別訓練數據中不常見對象的領域應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase