M

MMR1 Math V0 7B

Developed by MMR1
專注於數學任務的大型多模態模型,在開源7B多模態模型中實現最先進的性能
Downloads 75
Release Time : 3/11/2025

Model Overview

MMR1-Math-v0-7B是基於Qwen2.5-VL-7B-Instruct構建的多模態大模型,專注於數學推理任務。該模型僅使用6k精選數據樣本訓練即達到SOTA性能,在多個數學推理基準測試上表現優異。

Model Features

SOTA性能
在開源7B多模態模型中創下數學任務的新標杆
高效訓練
僅需6k高質量樣本和6小時RL訓練即可達到頂級表現
數據策略
基於任務難度和數學推理多樣性進行均勻採樣的高質量公開數據
GRPO訓練
使用64張H100顯卡進行高效RL訓練(15個epoch)

Model Capabilities

多模態數學推理
圖像文本理解
複雜數學問題解答
邏輯推理

Use Cases

教育
數學題目解答
幫助學生理解並解答覆雜的數學題目
在MathVista等基準測試上達到71.0分
研究
多模態推理研究
為多模態推理領域提供基準模型
在多個數學推理基準上超越同類模型
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase