A

Acemath 72B Instruct

Developed by nvidia
AceMathは、数学的推論用に設計された一連の最先端モデルで、Qwenをベースに改良され、思考過程(CoT)の推論を用いて英語の数学問題を解くことに長けています。
Downloads 3,141
Release Time : 1/14/2025

Model Overview

AceMathシリーズのモデルは、数学的推論タスクに特化しており、命令モデルと報酬モデルを含み、複雑な数学問題の解決や数学的解決策の評価に適しています。

Model Features

強力な数学的推論能力
AceMathモデルは、様々な数学的推論ベンチマークテストで優れた成績を収め、同類の最高モデルを大幅に上回っています。
専用の報酬モデル
AceMath - RMモデルは、数学的解決策の評価と採点に特化しており、推論ベンチマークテストで新記録を樹立しました。
多段階監督微調整
多段階監督微調整(SFT)プロセスを採用しており、まず汎用SFTデータを使用し、次に特定の数学SFTデータを使用します。

Model Capabilities

数学問題の解決
数学的推論
数学的解決策の評価
思考過程(CoT)の推論

Use Cases

教育
数学競技問題の解決
確率計算や組合せ数学などの複雑な数学競技問題を解きます。
数学的推論ベンチマークテストで優れた成績を収め、GPT - 4oやClaude 3.5 Sonnetを上回っています。
研究
数学的解決策の評価
報酬モデルを使用して数学的解決策の評価と採点を行います。
推論ベンチマークテストでrm@8正解率(8選択肢中の最適解)の新記録を樹立しました。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase