OpenMath2-Llama3.1-8B開源數學專用模型 - 免費使用，多基準測試表現優異

首頁

Openmath2 Llama3.1 8B

由nvidia開發

OpenMath2-Llama3.1-8B 是基於 Llama3.1-8B-Base 模型，使用 OpenMathInstruct-2 數據集微調而成的數學專用模型，在多個數學基準測試中表現優異。

大型語言模型

Transformers

英語#數學推理優化 #OpenMathInstruct-2微調 #MATH基準提升

下載量 930

發布時間 : 4/25/2025

模型概述

該模型專注於數學問題解決，在 MATH 等數學基準測試上顯著優於原版 Llama3.1-8B-Instruct 模型。

模型特點

數學性能提升

在 MATH 基準測試上比 Llama3.1-8B-Instruct 提升15.9%

專業數學訓練

使用 OpenMathInstruct-2 數據集專門針對數學問題進行微調

開源流程

數據生成和模型訓練流程完全開源

模型能力

數學問題解答

數學表達式求解

數學推理

使用案例

教育

數學問題解答

解決各類數學問題，包括代數、幾何等

在 GSM8K 測試集上達到91.7%準確率

數學競賽準備

幫助準備 AMC、AIME 等數學競賽

在 AMC 2023 測試中獲得16/40正確率

🚀 OpenMath2-Llama3.1-8B

OpenMath2-Llama3.1-8B 是通過使用 OpenMathInstruct-2 對 Llama3.1-8B-Base 進行微調得到的。該模型在我們評估的所有流行數學基準測試中都優於 Llama3.1-8B-Instruct，特別是在 MATH 基準測試中，性能提升了 15.9%。

Performance of Llama-3.1-8B-Instruct as it is trained on increasing proportions of OpenMathInstruct-2

Comparison of OpenMath2-Llama3.1-8B vs. Llama-3.1-8B-Instruct across MATH levels

模型	GSM8K	MATH	AMC 2023	AIME 2024	Omni-MATH
Llama3.1-8B-Instruct	84.5	51.9	9/40	2/30	12.7
OpenMath2-Llama3.1-8B (nemo \| HF)	91.7	67.8	16/40	3/30	22.0
+ majority@256	94.1	76.1	23/40	3/30	24.6
Llama3.1-70B-Instruct	95.8	67.9	19/40	6/30	19.0
OpenMath2-Llama3.1-70B (nemo \| HF)	94.9	71.9	20/40	4/30	23.1
+ majority@256	96.0	79.6	24/40	6/30	27.6

我們用於生成數據和模型的流程已完全開源！

查看我們的論文以瞭解更多詳情！

🚀 快速開始

模型使用方法

我們的模型採用與 Llama3.1 指令模型相同的“聊天格式”進行訓練（相同的系統/用戶/助手令牌）。請注意，這些模型未在通用數據上進行指令微調，因此在數學領域之外可能無法提供良好的答案。

我們建議使用我們倉庫中的說明對這些模型進行推理，但以下是一個通過 transformers API 進行推理的示例：

import transformers
import torch

model_id = "nvidia/OpenMath2-Llama3.1-8B"

pipeline = transformers.pipeline(
    "text-generation",
    model=model_id,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device_map="auto",
)

messages = [
    {
        "role": "user", 
        "content": "Solve the following math problem. Make sure to put the answer (and only answer) inside \\boxed{}.\n\n" + 
        "What is the minimum value of $a^2+6a-7$?"},
]

outputs = pipeline(
    messages,
    max_new_tokens=4096,
)
print(outputs[0]["generated_text"][-1]['content'])

復現結果

我們提供了所有說明以完全復現我們的結果。

📚 詳細文檔

引用

如果您覺得我們的工作有用，請考慮引用我們！

@article{toshniwal2024openmath2,
  title   = {OpenMathInstruct-2: Accelerating AI for Math with Massive Open-Source Instruction Data},
  author  = {Shubham Toshniwal and Wei Du and Ivan Moshkov and  Branislav Kisacanin and Alexan Ayrapetyan and Igor Gitman},
  year    = {2024},
  journal = {arXiv preprint arXiv:2410.01560}
}

使用條款

訪問此模型即表示您同意許可證、可接受使用政策和 Meta 隱私政策的 Llama 3.1 條款和條件。

📄 許可證

該模型使用的許可證為 llama3.1。

📦 模型信息

屬性	詳情
模型類型	OpenMath2-Llama3.1-8B
基礎模型	meta-llama/Llama-3.1-8B
訓練數據	nvidia/OpenMathInstruct-2
語言	en
標籤	nvidia, math
庫名稱	transformers