A

Acereason Nemotron 7B GGUF

由 QuantFactory 开发
AceReason-Nemotron-7B是一个基于强化学习训练的数学和代码推理模型,从DeepSeek-R1-Distilled-Qwen-7B开始训练,在多个基准测试中表现出色。
下载量 326
发布时间 : 6/13/2025

模型简介

该模型专注于数学和代码推理任务,通过强化学习训练提升性能,适用于解决复杂的数学问题和编程挑战。

模型特点

强化学习训练
完全通过强化学习进行训练,显著提升数学和代码推理能力。
优异的性能表现
在AIME 2024、AIME 2025、LiveCodeBench v5和v6等基准测试中取得显著提升。
有效训练方法
先对数学提示进行强化学习训练,再对代码提示进行训练,优化性能表现。

模型能力

数学问题求解
代码生成
复杂推理

使用案例

教育
数学竞赛题解答
解决复杂的数学竞赛题目,如AIME竞赛题。
在AIME 2024中达到69.0%的准确率。
编程
代码生成与优化
生成和优化Python代码,解决编程问题。
在LiveCodeBench v5中达到51.8%的准确率。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase