O

Owlvit Base Patch16

由google開發
OWL-ViT是一個零樣本文本條件目標檢測模型,可通過文本查詢在圖像中檢測物體。
下載量 4,588
發布時間 : 7/5/2022

模型概述

OWL-ViT是基於CLIP骨幹網絡的零樣本文本條件目標檢測模型,能夠通過一個或多個文本查詢在圖像中檢測物體,無需針對特定類別進行訓練。

模型特點

零樣本檢測能力
無需針對特定類別進行訓練,即可通過文本查詢檢測新物體
多文本查詢支持
支持使用一個或多個文本查詢同時檢測圖像中的不同物體
開放詞彙分類
通過替換固定分類層權重為文本嵌入,實現開放詞彙分類

模型能力

零樣本文本條件目標檢測
圖像物體定位
多類別同時檢測

使用案例

計算機視覺研究
零樣本目標檢測研究
用於研究模型在未見類別上的檢測能力
跨學科應用
特殊物體識別
在需要識別訓練期間標籤不可用物體的領域應用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase