A

Acereason Nemotron 14B GGUF

QuantFactoryによって開発
AceReason-Nemotron-14Bは強化学習によって訓練された数学とコード推論モデルで、複数の数学とコード推論の基準テストで優れた成績を収めています。
ダウンロード数 326
リリース時間 : 6/14/2025

モデル概要

このモデルは数学とコード推論タスクに特化しており、強化学習によって訓練され、数学とプログラミングの問題解決において優れた性能を持っています。

モデル特徴

強化学習訓練
完全に強化学習(RL)によって訓練された数学とコード推論モデル
体系的研究
広範なアブレーション実験を通じてRL訓練プロセスを体系的に研究しました
性能向上
数学とコード推論の基準テストで優れた成績を収めました
段階的訓練
まず数学のみのプロンプトでRL訓練を行い、次にコードのみのプロンプトでRL訓練を行います

モデル能力

数学問題解答
コード生成
段階的推論
複雑問題解決

使用事例

教育
数学コンテスト問題解答
高度な数学コンテストの問題、例えばAIMEコンテストの問題を解く
AIME 2024と2025のコンテスト問題で優れた成績を収めました
プログラミング
コード問題解決
問題の説明に基づいてPythonコードの解決策を生成する
LiveCodeBench基準テストで良好な成績を収めました
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase