A

Acemath RL Nemotron 7B GGUF

由Mungert開發
AceMath-RL-Nemotron-7B 是一個完全通過強化學習訓練的數學推理模型,基於 Deepseek-R1-Distilled-Qwen-7B 進行訓練,在數學推理任務中表現出色,同時在編碼任務上也有一定的泛化能力。
下載量 633
發布時間 : 5/10/2025

模型概述

該模型是一個專注於數學推理的強化學習訓練模型,提供多種量化格式以適應不同的硬件和內存需求。

模型特點

強化學習訓練
完全通過強化學習訓練,在數學推理任務中表現出色。
泛化能力強
在數學推理訓練的同時,提高了模型在編碼任務上的準確性。
多種量化格式
提供多種量化格式,以適應不同的硬件和內存需求。
精度自適應量化
超低比特模型引入精度自適應量化,在保持內存效率的同時保留準確性。

模型能力

數學推理
編碼任務
文本生成

使用案例

數學問題求解
概率計算
解決複雜的概率問題,如彩票中獎概率計算。
在 AIME 2024 和 2025 等數學競賽中表現優異。
編碼任務
代碼生成
生成代碼片段或解決編程問題。
在 LiveCodeBench 上表現良好。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase