O

Owlv2 Large Patch14 Ensemble

由Thomasboosinger開發
OWLv2是一種零樣本文本條件目標檢測模型,可通過文本查詢檢測圖像中的對象。
下載量 1
發布時間 : 2/19/2024

模型概述

OWLv2是基於CLIP主幹網絡的開放詞彙目標檢測模型,能夠通過文本查詢在圖像中檢測未在訓練中見過的對象類別。

模型特點

零樣本檢測能力
無需特定類別的訓練數據,僅通過文本描述即可檢測新類別對象
開放詞彙表
支持任意文本查詢作為檢測類別,不限於預定義的類別集合
多模態架構
結合視覺和語言模型,實現圖像與文本的聯合理解

模型能力

零樣本目標檢測
圖像理解
文本條件視覺搜索
多對象檢測

使用案例

計算機視覺研究
零樣本檢測研究
用於研究模型在未見類別上的泛化能力
跨學科應用
特殊對象識別
在醫療、農業等領域識別訓練數據中不常見的特殊對象
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase