OpenMath2-Llama3.1-8B开源数学专用模型 - 免费使用，多基准测试表现优异

首页

Openmath2 Llama3.1 8B

由 nvidia 开发

OpenMath2-Llama3.1-8B 是基于 Llama3.1-8B-Base 模型，使用 OpenMathInstruct-2 数据集微调而成的数学专用模型，在多个数学基准测试中表现优异。

大型语言模型

Transformers

英语#数学推理优化 #OpenMathInstruct-2微调 #MATH基准提升

下载量 930

发布时间 : 4/25/2025

模型简介

该模型专注于数学问题解决，在 MATH 等数学基准测试上显著优于原版 Llama3.1-8B-Instruct 模型。

模型特点

数学性能提升

在 MATH 基准测试上比 Llama3.1-8B-Instruct 提升15.9%

专业数学训练

使用 OpenMathInstruct-2 数据集专门针对数学问题进行微调

开源流程

数据生成和模型训练流程完全开源

模型能力

数学问题解答

数学表达式求解

数学推理

使用案例

教育

数学问题解答

解决各类数学问题，包括代数、几何等

在 GSM8K 测试集上达到91.7%准确率

数学竞赛准备

帮助准备 AMC、AIME 等数学竞赛

在 AMC 2023 测试中获得16/40正确率

🚀 OpenMath2-Llama3.1-8B

OpenMath2-Llama3.1-8B 是通过使用 OpenMathInstruct-2 对 Llama3.1-8B-Base 进行微调得到的。该模型在我们评估的所有流行数学基准测试中都优于 Llama3.1-8B-Instruct，特别是在 MATH 基准测试中，性能提升了 15.9%。

Performance of Llama-3.1-8B-Instruct as it is trained on increasing proportions of OpenMathInstruct-2

Comparison of OpenMath2-Llama3.1-8B vs. Llama-3.1-8B-Instruct across MATH levels

模型	GSM8K	MATH	AMC 2023	AIME 2024	Omni-MATH
Llama3.1-8B-Instruct	84.5	51.9	9/40	2/30	12.7
OpenMath2-Llama3.1-8B (nemo \| HF)	91.7	67.8	16/40	3/30	22.0
+ majority@256	94.1	76.1	23/40	3/30	24.6
Llama3.1-70B-Instruct	95.8	67.9	19/40	6/30	19.0
OpenMath2-Llama3.1-70B (nemo \| HF)	94.9	71.9	20/40	4/30	23.1
+ majority@256	96.0	79.6	24/40	6/30	27.6

我们用于生成数据和模型的流程已完全开源！

查看我们的论文以了解更多详情！

🚀 快速开始

模型使用方法

我们的模型采用与 Llama3.1 指令模型相同的“聊天格式”进行训练（相同的系统/用户/助手令牌）。请注意，这些模型未在通用数据上进行指令微调，因此在数学领域之外可能无法提供良好的答案。

我们建议使用我们仓库中的说明对这些模型进行推理，但以下是一个通过 transformers API 进行推理的示例：

import transformers
import torch

model_id = "nvidia/OpenMath2-Llama3.1-8B"

pipeline = transformers.pipeline(
    "text-generation",
    model=model_id,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device_map="auto",
)

messages = [
    {
        "role": "user", 
        "content": "Solve the following math problem. Make sure to put the answer (and only answer) inside \\boxed{}.\n\n" + 
        "What is the minimum value of $a^2+6a-7$?"},
]

outputs = pipeline(
    messages,
    max_new_tokens=4096,
)
print(outputs[0]["generated_text"][-1]['content'])

复现结果

我们提供了所有说明以完全复现我们的结果。

📚 详细文档

引用

如果您觉得我们的工作有用，请考虑引用我们！

@article{toshniwal2024openmath2,
  title   = {OpenMathInstruct-2: Accelerating AI for Math with Massive Open-Source Instruction Data},
  author  = {Shubham Toshniwal and Wei Du and Ivan Moshkov and  Branislav Kisacanin and Alexan Ayrapetyan and Igor Gitman},
  year    = {2024},
  journal = {arXiv preprint arXiv:2410.01560}
}

使用条款

访问此模型即表示您同意许可证、可接受使用政策和 Meta 隐私政策的 Llama 3.1 条款和条件。

📄 许可证

该模型使用的许可证为 llama3.1。

📦 模型信息

属性	详情
模型类型	OpenMath2-Llama3.1-8B
基础模型	meta-llama/Llama-3.1-8B
训练数据	nvidia/OpenMathInstruct-2
语言	en
标签	nvidia, math
库名称	transformers