V

Visualthinker R1 Zero

由turningpoint-ai開發
首個在僅一個非監督微調的2B模型上覆現'頓悟時刻'和響應長度增加的多模態推理模型
下載量 578
發布時間 : 2/28/2025

模型概述

基於Qwen2-VL-2B基礎模型,通過強化學習在SAT數據集上訓練,提升了視覺中心任務的推理能力

模型特點

頓悟時刻復現
首個在非監督微調的2B模型上成功復現DeepSeek-R1的'頓悟時刻'特徵
視覺中心推理
展示了視覺中心任務也能從改進的推理能力中受益
自我反思能力
模型表現出重新思考並糾正錯誤的湧現能力

模型能力

多模態推理
圖像理解
文本生成
視覺中心任務處理

使用案例

視覺推理
物體位置分析
分析圖像中物體的相對位置關係
在CVBench上達到59.47%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase