A

Acereason Nemotron 7B

nvidiaによって開発
強化学習でトレーニングされた数学とコード推論モデル、DeepSeek-R1-Distilled-Qwen-7Bをベースに、数学とコード推論タスクで優れたパフォーマンスを発揮
ダウンロード数 4,278
リリース時間 : 5/22/2025

モデル概要

AceReason-Nemotron-7Bは完全に強化学習(RL)でトレーニングされた数学とコード推論モデルで、ベースモデルはDeepSeek-R1-Distilled-Qwen-7Bです。このモデルは数学とコード推論タスクで顕著な向上を達成しました。

モデル特徴

強化学習トレーニング
完全に強化学習(RL)でトレーニングされ、数学とコード推論能力が顕著に向上
数学推論能力
AIME 2024で69.0%(14.5%向上)、AIME 2025で53.6%(17.4%向上)を達成
コード推論能力
LiveCodeBench v5で51.8%(8%向上)、LiveCodeBench v6で44.1%(7%向上)を達成
トレーニング方法の革新
純粋な数学プロンプトでRLトレーニングを行い、その後純粋なコードプロンプトでRLトレーニングを行うことで、効果が顕著

モデル能力

数学推論
コード生成
複雑な問題解決
段階的推論

使用事例

数学競技
AIME数学競技問題解答
AIME数学競技の複雑な問題を解決
AIME 2024で69.0%の精度を達成
プログラミング競技
LiveCodeBenchプログラミング問題解答
LiveCodeBenchのプログラミング問題を解決
LiveCodeBench v5で51.8%の精度を達成
教育支援
数学学習支援
学生が複雑な数学概念と解法を理解するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase