A

Acereason Nemotron 7B GGUF

由QuantFactory開發
AceReason-Nemotron-7B是一個基於強化學習訓練的數學和代碼推理模型,從DeepSeek-R1-Distilled-Qwen-7B開始訓練,在多個基準測試中表現出色。
下載量 326
發布時間 : 6/13/2025

模型概述

該模型專注於數學和代碼推理任務,通過強化學習訓練提升性能,適用於解決複雜的數學問題和編程挑戰。

模型特點

強化學習訓練
完全通過強化學習進行訓練,顯著提升數學和代碼推理能力。
優異的性能表現
在AIME 2024、AIME 2025、LiveCodeBench v5和v6等基準測試中取得顯著提升。
有效訓練方法
先對數學提示進行強化學習訓練,再對代碼提示進行訓練,優化性能表現。

模型能力

數學問題求解
代碼生成
複雜推理

使用案例

教育
數學競賽題解答
解決複雜的數學競賽題目,如AIME競賽題。
在AIME 2024中達到69.0%的準確率。
編程
代碼生成與優化
生成和優化Python代碼,解決編程問題。
在LiveCodeBench v5中達到51.8%的準確率。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase