A

Acereason Nemotron 14B GGUF

由 QuantFactory 开发
AceReason-Nemotron-14B是一个通过强化学习训练的数学和代码推理模型,在多个数学和代码推理基准测试中表现出色。
下载量 326
发布时间 : 6/14/2025

模型简介

该模型专注于数学和代码推理任务,通过强化学习训练,在数学和编程问题解决方面具有优异性能。

模型特点

强化学习训练
完全通过强化学习(RL)训练的数学和代码推理模型
系统性研究
通过广泛的消融实验系统地研究了RL训练过程
性能提升
在数学和代码推理基准测试中取得了出色的成绩
分阶段训练
先在仅含数学的提示上进行RL训练,然后在仅含代码的提示上进行RL训练

模型能力

数学问题解答
代码生成
逐步推理
复杂问题解决

使用案例

教育
数学竞赛题解答
解决高级数学竞赛题目,如AIME竞赛题
在AIME 2024和2025竞赛题上表现优异
编程
代码问题解决
根据问题描述生成Python代码解决方案
在LiveCodeBench基准测试中表现良好
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase