O

Owlvit Base Patch32

由Xenova開發
OWL-ViT是一個基於視覺Transformer的零樣本目標檢測模型,能夠在不進行微調的情況下檢測新類別的物體。
下載量 86
發布時間 : 11/13/2023

模型概述

該模型是基於Transformer架構的零樣本目標檢測模型,能夠根據提供的文本標籤檢測圖像中的物體,無需針對特定類別進行訓練。

模型特點

零樣本檢測能力
無需針對特定類別進行訓練,即可檢測新類別的物體
文本引導檢測
通過文本描述指定要檢測的物體類別
基於Transformer架構
採用視覺Transformer架構,結合文本和圖像信息
網頁端適配
提供ONNX格式權重,便於在瀏覽器環境中使用

模型能力

零樣本目標檢測
多類別物體識別
文本引導的圖像分析
邊界框預測

使用案例

圖像分析
物體檢測
在圖像中檢測指定類別的物體
返回檢測到的物體類別、置信度和邊界框座標
內容審核
敏感內容檢測
檢測圖像中是否存在特定類型的敏感內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase