O

Owlv2 Large Patch14 Finetuned

由google開發
OWLv2是一個零樣本文本條件目標檢測模型,可通過文本查詢在圖像中檢測物體,無需特定類別的訓練數據。
下載量 1,434
發布時間 : 10/14/2023

模型概述

OWLv2是基於CLIP骨幹網絡的零樣本文本條件目標檢測模型,能夠通過一個或多個文本查詢在圖像中檢測物體。它使用ViT-L/14作為視覺編碼器,通過對比損失訓練,並在標準檢測數據集上微調。

模型特點

零樣本檢測能力
無需特定類別的訓練數據,僅通過文本查詢即可檢測圖像中的物體。
開放詞彙分類
通過替換固定分類層權重為文本嵌入,支持任意類名的檢測。
多查詢檢測
支持使用一個或多個文本查詢同時檢測圖像中的不同物體。

模型能力

文本條件目標檢測
開放詞彙物體識別
多類別同時檢測

使用案例

計算機視覺研究
零樣本目標檢測研究
用於研究模型在未見類別上的檢測能力。
跨學科應用
特殊場景物體識別
在訓練數據難以獲取的特殊領域(如醫療、工業)進行物體檢測。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase