O

Owlv2 Large Patch14 Ensemble

由google開發
OWLv2是一個零樣本文本條件目標檢測模型,可通過文本查詢在圖像中定位對象。
下載量 262.77k
發布時間 : 10/13/2023

模型概述

OWLv2是基於CLIP骨幹網絡的零樣本文本條件目標檢測模型,能夠在沒有特定訓練的情況下,通過文本描述檢測圖像中的對象。

模型特點

零樣本檢測
無需特定對象類別的訓練數據,即可通過文本描述檢測新對象
文本條件檢測
支持通過一個或多個文本查詢進行圖像檢測
開放詞彙分類
使用文本嵌入代替固定分類層,支持任意類名

模型能力

零樣本目標檢測
文本條件圖像分析
多對象同時檢測

使用案例

計算機視覺研究
零樣本檢測研究
研究模型在未見過的對象類別上的檢測能力
跨學科應用
特殊領域對象檢測
在缺乏訓練數據的專業領域(如醫學、工業)進行對象檢測
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase