M

MMR1 Math V0 7B

由MMR1開發
專注於數學任務的大型多模態模型,在開源7B多模態模型中實現最先進的性能
下載量 75
發布時間 : 3/11/2025

模型概述

MMR1-Math-v0-7B是基於Qwen2.5-VL-7B-Instruct構建的多模態大模型,專注於數學推理任務。該模型僅使用6k精選數據樣本訓練即達到SOTA性能,在多個數學推理基準測試上表現優異。

模型特點

SOTA性能
在開源7B多模態模型中創下數學任務的新標杆
高效訓練
僅需6k高質量樣本和6小時RL訓練即可達到頂級表現
數據策略
基於任務難度和數學推理多樣性進行均勻採樣的高質量公開數據
GRPO訓練
使用64張H100顯卡進行高效RL訓練(15個epoch)

模型能力

多模態數學推理
圖像文本理解
複雜數學問題解答
邏輯推理

使用案例

教育
數學題目解答
幫助學生理解並解答覆雜的數學題目
在MathVista等基準測試上達到71.0分
研究
多模態推理研究
為多模態推理領域提供基準模型
在多個數學推理基準上超越同類模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase