MetaMath-7B-V1.0開源數學推理模型 - 免費部署解決複雜數學問題

首頁

Metamath 7B V1.0

由meta-math開發

MetaMath-Llemma-7B是基於MetaMathQA數據集全參數微調的數學推理模型，在GSM8K和MATH數據集上表現優異。

大型語言模型

Transformers

#數學推理增強 #分步解答生成 #數學問題求解

下載量 278

發布時間 : 9/21/2023

模型概述

該模型專注於數學問題求解，通過逐步推理的方式解決複雜的數學問題，適用於教育輔助和數學研究領域。

模型特點

數學推理能力增強

通過MetaMathQA數據集增強訓練，顯著提升數學問題求解能力

逐步推理

採用'讓我們逐步思考'的提示模板，引導模型進行分步推理

性能提升

相比基礎模型，在MATH評測中分數從19.8提升至30.0

模型能力

數學問題求解

逐步推理

數學表達式處理

使用案例

教育

數學題目解答

幫助學生理解複雜數學問題的解題過程

在GSM8K數據集上達到69.2%準確率

研究

數學推理研究

用於研究大型語言模型的數學推理能力

在MATH數據集上達到30.0%準確率

🚀 MetaMath-Llemma-7B項目

MetaMath-Llemma-7B是基於強大的Llemma-7B模型，在MetaMathQA數據集上進行全量微調的模型。該模型在數學任務上表現出色，能有效提升解題性能。

🚀 快速開始

你可以通過以下鏈接查看項目相關信息：

論文鏈接：https://arxiv.org/abs/2309.12284
項目主頁：https://meta-math.github.io/

✨ 主要特性

數據來源可靠：所有MetaMathQA數據均從GSM8K和MATH的訓練集擴充而來，無測試集數據。
性能提升顯著：使用MetaMathQA數據集，並將基礎模型從llama-2-7B更換為Llemma-7B後，MATH任務的Pass@1指標從19.8提升到了30.0。

📦 安裝指南

使用以下命令安裝所需依賴：

pip install transformers==4.35.0
pip install torch==2.0.1
pip install sentencepiece==0.1.99
pip install tokenizers==0.13.3
pip install accelerate==0.21.0
pip install bitsandbytes==0.40.0
pip install vllm
pip install fraction
pip install protobuf

💻 使用示例

基礎用法

模型的提示模板如下：

"Below is an instruction that describes a task. "
"Write a response that appropriately completes the request.\n\n"
"### Instruction:\n{instruction}\n\n### Response: Let's think step by step."

你需要將{instruction}替換為你的查詢問題。

📚 詳細文檔

數據說明

所有MetaMathQA數據均從GSM8K和MATH的訓練集擴充而來，你可以查看meta-math/MetaMathQA中的original_question，每個條目都來自GSM8K或MATH的訓練集。

實驗結果

以下是不同模型在GSM8k和MATH任務上的Pass@1指標對比：

模型	GSM8k Pass@1	MATH Pass@1
MPT-7B	6.8	3.0
Falcon-7B	6.8	2.3
LLaMA-1-7B	11.0	2.9
LLaMA-2-7B	14.6	2.5
MPT-30B	15.2	3.1
LLaMA-1-13B	17.8	3.9
GPT-Neo-2.7B	19.5	--
Falcon-40B	19.6	2.5
Baichuan-chat-13B	23.9	--
Vicuna-v1.3-13B	27.6	--
LLaMA-2-13B	28.7	3.9
InternLM-7B	31.2	--
ChatGLM-2-6B	32.4	--
GPT-J-6B	34.9	--
LLaMA-1-33B	35.6	3.9
LLaMA-2-34B	42.2	6.24
RFT-7B	50.3	--
LLaMA-1-65B	50.9	10.6
Qwen-7B	51.6	--
WizardMath-7B	54.9	10.7
LLaMA-2-70B	56.8	13.5
WizardMath-13B	63.9	14.0
MAmmoTH-7B (COT)	50.5	10.4
MAmmoTH-7B (POT+COT)	53.6	31.5
Arithmo-Mistral-7B	74.7	25.3
MetaMath-7B	66.5	19.8
MetaMath-13B	72.3	22.4
🔥 MetaMath-Llemma-7B	69.2	30.0
🔥 MetaMath-Mistral-7B	77.7	28.2

📄 許可證

本項目使用的許可證為llama2。

📚 引用信息

如果你使用了本項目的相關內容，請引用以下論文：

@article{yu2023metamath,
  title={MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models},
  author={Yu, Longhui and Jiang, Weisen and Shi, Han and Yu, Jincheng and Liu, Zhengying and Zhang, Yu and Kwok, James T and Li, Zhenguo and Weller, Adrian and Liu, Weiyang},
  journal={arXiv preprint arXiv:2309.12284},
  year={2023}
}