MathGenie-InterLM-20B开源数学大模型 - 增强数学推理能力，免费部署不用愁！

首页

Mathgenie InterLM 20B

由 MathGenie 开发

MathGenie是一种通过问题回译生成合成数据以增强大语言模型数学推理能力的模型。

大型语言模型

Transformers

支持多种语言开源协议:Apache-2.0 #数学推理增强 #问题回译生成 #代码集成解答

下载量 32

发布时间 : 2/27/2024

模型简介

MathGenie方法通过小规模问题-答案数据集生成多样化且可靠的数学题目，增强大语言模型的数学推理能力。

模型特点

问题回译生成

通过小规模种子数据生成多样化且可靠的数学题目。

代码集成式解答

为新问题生成代码集成式解答方案，并通过基于原理的验证策略确保解答的正确性。

高性能数学推理

在五大代表性数学推理数据集上全面超越此前开源模型，达到最先进水平。

模型能力

数学题目生成

数学推理

代码集成解答

问题回译

使用案例

教育

数学题目生成

生成多样化的数学题目，用于教育领域的练习和测试。

生成题目多样化且可靠，适用于不同难度级别的数学练习。

研究

数学推理研究

用于研究大语言模型在数学推理方面的性能提升。

在GSM8K数据集准确率达87.7%，MATH数据集达55.7%。

🚀 MathGenie：通过问题回译生成合成数据以增强大语言模型的数学推理能力

MathGenie是一个用于论文 "MathGenie: Generating Synthetic Data with Question Back-translation for Enhancing Mathematical Reasoning of LLMs" 的模型。该模型旨在通过问题回译生成合成数据，从而增强大语言模型（LLMs）的数学推理能力。

📢 最新消息

[2024-02-26] 我们的论文现已可在 ArXiv Paper 上获取。

✨ 主要特性

大语言模型（LLMs）在数学推理方面展现出了巨大的潜力。然而，现有的开源模型在这一领域的表现与GPT - 4等闭源模型之间仍存在差距。

在本文中，我们引入了 MathGenie，这是一种从小规模问题 - 解决方案数据集（称为 种子数据）中生成多样化且可靠数学问题的新方法。我们对种子数据的真实解决方案进行增强，并训练一个回译模型，将增强后的解决方案回译为新的问题。随后，我们为这些新问题生成集成代码的解决方案。为确保集成代码解决方案的正确性，我们采用基于推理的策略进行解决方案验证。

我们在新整理的数据上训练了从7B到70B的各种预训练模型，以测试所提出的增强技术的有效性，得到了一系列名为 MathGenieLM 的模型。这些模型在五个具有代表性的数学推理数据集上始终优于以往的开源模型，达到了当前的最优性能。特别是，MathGenieLM - InternLM2在GSM8K上的准确率达到了87.7%，在MATH上达到了55.7%，在开源语言模型中获得了最佳的整体得分。

更多详细信息可参考项目主页和论文。

💻 使用示例

模型

我们的 MathGenie - InterLM - 20B 模型和 MathGenie - Mixtral - 8x7B 模型现已在Huggingface上可用。

基础模型	模型
InternLM - 20B	MathGenie - InterLM - 20B
Mixtral - 8x7B	MathGenie - Mixtral - 8x7B

推理与评估

模板

{% for message in messages %}
{% if message['role'] == 'user' %}
{{ '<|user|>' }}{% elif message['role'] == 'system' %}
{{ '<|system|>' }}{% elif message['role'] == 'assistant' %}
{{ '<|assistant|>' }}{% endif %}
{% for block in message['content'] %}
{% if block['type'] == 'text' %}
{{ '<|text|>' }}{% elif block['type'] == 'code' %}
{{ '<|code|>' }}{% elif block['type'] == 'execution' %}
{{ '<|execution|>' }}{% endif %}
{{ block['content'] + '<|endofblock|>' }}{% endfor %}
{{ '<|endofmessage|>' }}{% endfor %}

有关我们的MathGenieLM模型推理和评估的详细代码，请参考 MathCoder仓库。

📖 引用

如果您发现本文对您的研究有帮助，请引用以下BibTex：

@misc{lu2024mathgenie,
			title={MathGenie: Generating Synthetic Data with Question Back-translation for Enhancing Mathematical Reasoning of LLMs}, 
      author={Zimu Lu and Aojun Zhou and Houxing Ren and Ke Wang and Weikang Shi and Junting Pan and Mingjie Zhan and Hongsheng Li},
      year={2024},
      eprint={2402.16352},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

@inproceedings{
			wang2024mathcoder,
			title={MathCoder: Seamless Code Integration in {LLM}s for Enhanced Mathematical Reasoning},
			author={Ke Wang and Houxing Ren and Aojun Zhou and Zimu Lu and Sichun Luo and Weikang Shi and Renrui Zhang and Linqi Song and Mingjie Zhan and Hongsheng Li},
			booktitle={The Twelfth International Conference on Learning Representations},
			year={2024},
			url={https://openreview.net/forum?id=z8TW0ttBPp}
}