T

TBAC VLR1 3B Preview

由TencentBAC開發
由騰訊PCG基礎算法中心微調的多模態語言模型,基於Qwen2.5-VL-3B-Instruct優化,在同規模模型中實現多項多模態推理基準的最先進性能
下載量 328
發布時間 : 4/16/2025

模型概述

採用分組相對策略優化(GRPO)技術增強多模態推理能力的視覺語言模型

模型特點

GRPO優化技術
採用分組相對策略優化技術增強多模態推理能力
領先性能
在同規模模型中實現多項多模態推理基準的最先進性能
數學推理能力
在MathVista等數學推理基準上表現優異

模型能力

多模態理解
視覺語言推理
數學問題求解
邏輯推理
圖像文本生成

使用案例

教育
數學題目解答
解析包含數學公式和圖形的題目
在MathVista基準上達到64.8分
研究
多模態推理研究
用於視覺語言推理任務的研究
在綜合評估中達到35.7的平均分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase