OpenMath2-Llama3.1-70B 開源數學大語言模型

首頁

Openmath2 Llama3.1 70B

由nvidia開發

OpenMath2-Llama3.1-70B 是基於 Llama3.1-70B-Base 模型，使用 OpenMathInstruct-2 數據集進行微調的數學專用大語言模型。

大型語言模型

Transformers

英語#數學問題求解 #高精度數學推理 #開源數學微調

下載量 923

發布時間 : 9/30/2024

模型概述

該模型專注於數學問題求解，在多個數學基準測試上表現優於原版 Llama3.1-70B-Instruct 模型。

模型特點

數學性能提升

在 MATH 基準測試上比 Llama3.1-70B-Instruct 高出 3.9%

開源流程

數據生成和模型訓練流程完全開源

專業數學能力

專注於數學領域的問題求解

模型能力

數學問題求解

數學表達式計算

數學推理

使用案例

教育

數學問題解答

幫助學生解決各類數學問題

在 GSM8K 測試集上達到 94.9% 準確率

學術研究

數學競賽問題求解

解決 AMC 和 AIME 等數學競賽題目

在 AMC 2023 上獲得 20/40 的正確率

🚀 OpenMath2-Llama3.1-70B

OpenMath2-Llama3.1-70B 是通過使用 OpenMathInstruct-2 對 Llama3.1-70B-Base 進行微調得到的。該模型在 MATH 數據集上的表現比 Llama3.1-70B-Instruct 高出 3.9%。

✨ 主要特性

模型微調：基於 Llama3.1-70B-Base 模型，使用 OpenMathInstruct-2 數據集進行微調。
性能提升：在數學相關數據集上的表現優於 Llama3.1-70B-Instruct。
開源透明：用於生成數據和模型的流程完全開源。

📋 模型信息

屬性	詳情
模型類型	OpenMath2-Llama3.1-70B
基礎模型	meta-llama/Llama-3.1-70B
訓練數據	nvidia/OpenMathInstruct-2
許可證	llama3.1

📊 模型性能對比

模型	GSM8K	MATH	AMC 2023	AIME 2024	Omni-MATH
Llama3.1-8B-Instruct	84.5	51.9	9/40	2/30	12.7
OpenMath2-Llama3.1-8B (nemo \| HF)	91.7	67.8	16/40	3/30	22.0
+ majority@256	94.1	76.1	23/40	3/30	24.6
Llama3.1-70B-Instruct	95.8	67.9	19/40	6/30	19.0
OpenMath2-Llama3.1-70B (nemo \| HF)	94.9	71.9	20/40	4/30	23.1
+ majority@256	96.0	79.6	24/40	6/30	27.6

💻 使用示例

基礎用法

import transformers
import torch

model_id = "nvidia/OpenMath2-Llama3.1-70B"

pipeline = transformers.pipeline(
    "text-generation",
    model=model_id,
    model_kwargs={"torch_dtype": torch.bfloat16},
    device_map="auto",
)

messages = [
    {
        "role": "user", 
        "content": "Solve the following math problem. Make sure to put the answer (and only answer) inside \\boxed{}.\n\n" + 
        "What is the minimum value of $a^2+6a-7$?"},
]

outputs = pipeline(
    messages,
    max_new_tokens=4096,
)
print(outputs[0]["generated_text"][-1]['content'])

🔗 開源資源

我們用於生成數據和模型的流程完全開源！

📚 詳細文檔

如需瞭解更多詳細信息，請查看我們的論文。

🔄 結果復現

我們提供了所有說明以完全復現我們的結果。

📖 引用

如果您覺得我們的工作有用，請考慮引用我們！

@article{toshniwal2024openmath2,
  title   = {OpenMathInstruct-2: Accelerating AI for Math with Massive Open-Source Instruction Data},
  author  = {Shubham Toshniwal and Wei Du and Ivan Moshkov and  Branislav Kisacanin and Alexan Ayrapetyan and Igor Gitman},
  year    = {2024},
  journal = {arXiv preprint arXiv:2410.01560}
}