V

VLM R1 Qwen2.5VL 3B OVD 0321

由omlab開發
基於Qwen2.5-VL-3B-Instruct的零樣本目標檢測模型,通過VLM-R1強化學習增強,支持開放詞彙檢測任務。
下載量 892
發布時間 : 3/21/2025

模型概述

該模型結合視覺語言模型與強化學習技術,專門用於開放詞彙目標檢測(OVD),能夠識別訓練數據中未明確標註的新類別對象。

模型特點

強化學習增強
採用VLM-R1強化學習算法優化模型性能
開放詞彙檢測
支持識別訓練數據中未包含的新類別對象
多模態理解
結合視覺和語言信息進行目標檢測

模型能力

零樣本目標檢測
開放詞彙識別
多模態理解
視覺語言推理

使用案例

計算機視覺
智能監控
檢測監控畫面中出現的未知類別物體
自動駕駛
識別道路環境中訓練數據未覆蓋的新類型障礙物
零售分析
商品識別
識別新上市商品的類別和屬性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase