A

Acemath 72B Instruct

由nvidia開發
AceMath 是一系列專為數學推理設計的前沿模型,基於 Qwen 改進,擅長使用思維鏈(CoT)推理解決英文數學問題。
下載量 3,141
發布時間 : 1/14/2025

模型概述

AceMath 系列模型專注於數學推理任務,包括指令模型和獎勵模型,適用於解決複雜的數學問題和評估數學解決方案。

模型特點

強大的數學推理能力
AceMath 模型在多種數學推理基準測試中表現出色,大幅超過同類最佳模型。
專業的獎勵模型
AceMath - RM 模型專門用於評估和評分數學解決方案,在推理基準測試中創下新紀錄。
多階段監督微調
採用多階段監督微調(SFT)過程,先使用通用 SFT 數據,再使用特定數學 SFT 數據。

模型能力

數學問題解決
數學推理
數學解決方案評估
思維鏈(CoT)推理

使用案例

教育
數學競賽問題解決
解決複雜的數學競賽問題,如概率計算、組合數學等。
在數學推理基準測試中表現優異,超越 GPT-4o 和 Claude 3.5 Sonnet。
研究
數學解決方案評估
使用獎勵模型對數學解決方案進行評估和評分。
在推理基準測試中創下 rm@8 準確率(8 選最佳)的新紀錄。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase