M

Metamath Llemma 7B

由meta-math開發
MetaMath-Llemma-7B是基於Llemma-7B基礎模型在MetaMathQA數據集上完整微調的數學專用大語言模型,顯著提升了數學問題解決能力。
下載量 3,192
發布時間 : 11/19/2023

模型概述

該模型專注於數學問題的解決,通過增強訓練數據顯著提升了在GSM8K和MATH等數學數據集上的表現。

模型特點

數學能力增強
通過MetaMathQA數據集微調,顯著提升數學問題解決能力,MATH性能從19.8提升至30.0。
基於Llemma-7B優化
採用專為數學優化的Llemma-7B作為基礎模型,相比標準LLaMA-2-7B有顯著性能提升。
訓練數據驗證
所有增強數據均源自GSM8K和MATH訓練集,不包含測試集內容,確保評估公平性。

模型能力

數學問題解答
逐步推理
數學表達式處理

使用案例

教育
數學題目解答
幫助學生理解並解決各類數學問題
在GSM8K上達到69.2%準確率
研究
數學推理研究
用於研究大語言模型的數學推理能力
在MATH上達到30.0%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase