MetaMath-Llemma-7B开源数学大模型 - 免费部署，显著提升数学问题解决能力

首页

Metamath Llemma 7B

由 meta-math 开发

MetaMath-Llemma-7B是基于Llemma-7B基础模型在MetaMathQA数据集上完整微调的数学专用大语言模型，显著提升了数学问题解决能力。

大型语言模型

Transformers

开源协议:Apache-2.0 #数学推理增强 #逐步思考提示 #教育领域专用

下载量 3,192

发布时间 : 11/19/2023

模型简介

该模型专注于数学问题的解决，通过增强训练数据显著提升了在GSM8K和MATH等数学数据集上的表现。

模型特点

数学能力增强

通过MetaMathQA数据集微调，显著提升数学问题解决能力，MATH性能从19.8提升至30.0。

基于Llemma-7B优化

采用专为数学优化的Llemma-7B作为基础模型，相比标准LLaMA-2-7B有显著性能提升。

训练数据验证

所有增强数据均源自GSM8K和MATH训练集，不包含测试集内容，确保评估公平性。

模型能力

数学问题解答

逐步推理

数学表达式处理

使用案例

教育

数学题目解答

帮助学生理解并解决各类数学问题

在GSM8K上达到69.2%准确率

研究

数学推理研究

用于研究大语言模型的数学推理能力

在MATH上达到30.0%准确率

🚀 MetaMath-Llemma-7B模型

MetaMath-Llemma-7B模型基于强大的Llemma-7B模型，在MetaMathQA数据集上进行了全量微调。该模型在数学问答任务中表现出色，显著提升了MATH任务的性能。

🚀 快速开始

你可以通过以下链接查看相关论文和项目页面：

论文链接：https://arxiv.org/abs/2309.12284
项目页面：https://meta-math.github.io/

✨ 主要特性

数据来源可靠：所有MetaMathQA数据均从GSM8K和MATH的训练集增强而来，无测试集数据。
性能显著提升：使用MetaMathQA数据集并将基础模型从llama - 2 - 7B更换为Llemma - 7B后，MATH性能从19.8提升到了30.0。

📦 安装指南

使用以下命令安装所需的依赖库：

pip install transformers==4.35.0
pip install torch==2.0.1
pip install sentencepiece==0.1.99
pip install tokenizers==0.13.3
pip install accelerate==0.21.0
pip install bitsandbytes==0.40.0
pip install vllm
pip install fraction
pip install protobuf

💻 使用示例

基础用法

模型的提示模板如下：

"Below is an instruction that describes a task. "
"Write a response that appropriately completes the request.\n\n"
"### Instruction:\n{instruction}\n\n### Response: Let's think step by step."

你需要用你的查询问题替换{instruction}。

📚 详细文档

实验结果

以下是不同模型在GSM8k和MATH任务上的Pass@1指标对比：

模型	GSM8k Pass@1	MATH Pass@1
MPT - 7B	6.8	3.0
Falcon - 7B	6.8	2.3
LLaMA - 1 - 7B	11.0	2.9
LLaMA - 2 - 7B	14.6	2.5
MPT - 30B	15.2	3.1
LLaMA - 1 - 13B	17.8	3.9
GPT - Neo - 2.7B	19.5	--
Falcon - 40B	19.6	2.5
Baichuan - chat - 13B	23.9	--
Vicuna - v1.3 - 13B	27.6	--
LLaMA - 2 - 13B	28.7	3.9
InternLM - 7B	31.2	--
ChatGLM - 2 - 6B	32.4	--
GPT - J - 6B	34.9	--
LLaMA - 1 - 33B	35.6	3.9
LLaMA - 2 - 34B	42.2	6.24
RFT - 7B	50.3	--
LLaMA - 1 - 65B	50.9	10.6
Qwen - 7B	51.6	--
WizardMath - 7B	54.9	10.7
LLaMA - 2 - 70B	56.8	13.5
WizardMath - 13B	63.9	14.0
MAmmoTH - 7B (COT)	50.5	10.4
MAmmoTH - 7B (POT + COT)	53.6	31.5
Arithmo - Mistral - 7B	74.7	25.3
MetaMath - 7B	66.5	19.8
MetaMath - 13B	72.3	22.4
🔥 MetaMath - Llemma - 7B	69.2	30.0
🔥 MetaMath - Mistral - 7B	77.7	28.2

引用信息

如果你使用了该模型或相关数据集，请引用以下论文：

@article{yu2023metamath,
  title={MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models},
  author={Yu, Longhui and Jiang, Weisen and Shi, Han and Yu, Jincheng and Liu, Zhengying and Zhang, Yu and Kwok, James T and Li, Zhenguo and Weller, Adrian and Liu, Weiyang},
  journal={arXiv preprint arXiv:2309.12284},
  year={2023}
}

@article{azerbayev2023llemma,
  title={Llemma: An open language model for mathematics},
  author={Azerbayev, Zhangir and Schoelkopf, Hailey and Paster, Keiran and Santos, Marco Dos and McAleer, Stephen and Jiang, Albert Q and Deng, Jia and Biderman, Stella and Welleck, Sean},
  journal={arXiv preprint arXiv:2310.10631},
  year={2023}
}