A

Acemath RL Nemotron 7B GGUF

由 Mungert 开发
AceMath-RL-Nemotron-7B 是一个完全通过强化学习训练的数学推理模型,基于 Deepseek-R1-Distilled-Qwen-7B 进行训练,在数学推理任务中表现出色,同时在编码任务上也有一定的泛化能力。
下载量 633
发布时间 : 5/10/2025

模型简介

该模型是一个专注于数学推理的强化学习训练模型,提供多种量化格式以适应不同的硬件和内存需求。

模型特点

强化学习训练
完全通过强化学习训练,在数学推理任务中表现出色。
泛化能力强
在数学推理训练的同时,提高了模型在编码任务上的准确性。
多种量化格式
提供多种量化格式,以适应不同的硬件和内存需求。
精度自适应量化
超低比特模型引入精度自适应量化,在保持内存效率的同时保留准确性。

模型能力

数学推理
编码任务
文本生成

使用案例

数学问题求解
概率计算
解决复杂的概率问题,如彩票中奖概率计算。
在 AIME 2024 和 2025 等数学竞赛中表现优异。
编码任务
代码生成
生成代码片段或解决编程问题。
在 LiveCodeBench 上表现良好。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase