A

Acereason Nemotron 14B

Developed by nvidia
AceReason-Nemotron-14Bは強化学習でトレーニングされた数学とコード推論モデルで、DeepSeek-R1-Distilled-Qwen-14Bをベースとしており、数学とコード推論タスクで卓越した性能を発揮します。
Downloads 7,863
Release Time : 5/20/2025

Model Overview

AceReason-Nemotron-14Bは完全に強化学習(RL)でトレーニングされた数学とコード推論モデルで、ベースモデルはDeepSeek-R1-Distilled-Qwen-14Bです。このモデルは数学とコード推論タスクで優れた性能を示し、大量のアブレーション実験を通じてRLトレーニングプロセスを体系的に研究し、純粋な数学プロンプトでRLトレーニングを行った後、純粋なコードプロンプトでRLトレーニングを行うというシンプルで効果的な方法を提案しています。

Model Features

強化学習トレーニング
完全に強化学習(RL)でトレーニングされており、数学とコード推論能力が大幅に向上しています。
段階的トレーニング手法
最初に純粋な数学プロンプトでRLトレーニングを行い、次に純粋なコードプロンプトでRLトレーニングを行うことで、モデル性能を最適化します。
高性能推論
AIME 2024、AIME 2025、LiveCodeBenchなどのベンチマークテストで卓越した性能を発揮します。

Model Capabilities

数学推論
コード生成
テキスト生成
強化学習

Use Cases

数学推論
数学競技問題解答
AIME 2024やAIME 2025の問題など、複雑な数学競技問題を解決します。
AIME 2024で78.6%(8.9%向上)、AIME 2025で67.4%(17.4%向上)を達成。
コード生成
コード競技問題解答
コード競技問題を解決するPythonコードを生成します。
LiveCodeBench v5で61.1%(8%向上)、LiveCodeBench v6で54.9%(7%向上)を達成。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase