A

Acereason Nemotron 14B GGUF

unslothによって開発
強化学習で訓練された数学とプログラミング推論モデルで、複数のベンチマークテストで優れた性能を発揮
ダウンロード数 1,417
リリース時間 : 5/23/2025

モデル概要

AceReason-Nemotron-14Bは完全に強化学習で訓練された数学とプログラミング推論モデルで、DeepSeek-R1-Distilled-Qwen-14Bを基に開発され、数学とプログラミング推論タスクで顕著な向上を達成しました。

モデル特徴

強化学習訓練
完全に強化学習で訓練され、数学とプログラミング推論能力が大幅に向上
2段階訓練方法
最初に純粋な数学プロンプトでRL訓練を行い、その後純粋なプログラミングプロンプトでRL訓練を実施
分野横断的向上
純粋数学RLは数学能力だけでなく、プログラミング推論性能も向上させた
Unsloth最適化
Unsloth Dynamic 2.0を採用し、他の量子化手法を超える卓越した精度を実現

モデル能力

数学推論
プログラミング推論
複雑問題解決
コード生成

使用事例

数学競技
AIME競技問題解答
アメリカ数学招待試験(AIME)問題を解決
AIME 2024で78.6%達成、8.9%向上
プログラミング競技
LiveCodeBenchテスト
プログラミング競技問題を解決
LiveCodeBench v5で61.1%達成、8%向上
Codeforces競技
Codeforcesプログラミング問題を解決
Codeforcesスコア543点上昇
教育
数学学習支援
学生が複雑な数学問題を理解し解決するのを支援
プログラミング学習支援
アルゴリズムとプログラミング技術の学習を補助
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase