A

Acereason Nemotron 14B GGUF

由QuantFactory開發
AceReason-Nemotron-14B是一個通過強化學習訓練的數學和代碼推理模型,在多個數學和代碼推理基準測試中表現出色。
下載量 326
發布時間 : 6/14/2025

模型概述

該模型專注於數學和代碼推理任務,通過強化學習訓練,在數學和編程問題解決方面具有優異性能。

模型特點

強化學習訓練
完全通過強化學習(RL)訓練的數學和代碼推理模型
系統性研究
通過廣泛的消融實驗系統地研究了RL訓練過程
性能提升
在數學和代碼推理基準測試中取得了出色的成績
分階段訓練
先在僅含數學的提示上進行RL訓練,然後在僅含代碼的提示上進行RL訓練

模型能力

數學問題解答
代碼生成
逐步推理
複雜問題解決

使用案例

教育
數學競賽題解答
解決高級數學競賽題目,如AIME競賽題
在AIME 2024和2025競賽題上表現優異
編程
代碼問題解決
根據問題描述生成Python代碼解決方案
在LiveCodeBench基準測試中表現良好
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase