F

Fastcurl 1.5B Preview

由Nickyang開發
FastCuRL-1.5B-Preview 是一個慢思考推理模型,採用課程引導迭代延長強化學習方法,在數學推理任務上表現優異。
下載量 779
發布時間 : 3/17/2025

模型概述

該模型基於 DeepSeek-R1-Distill-Qwen-1.5B 進行訓練,專注於數學推理任務,在多項數學基準測試中超越同類模型。

模型特點

課程引導迭代延長強化學習
採用新穎的訓練方法,顯著提升模型性能
高效訓練
僅用50%的訓練步數就超越了之前的SOTA模型
數學推理專精
在多項數學基準測試中表現優異

模型能力

數學問題解答
複雜推理
數學競賽題求解

使用案例

教育
數學競賽訓練
幫助學生準備AIME、AMC等數學競賽
在AIME 2024測試中達到43.1%準確率
數學問題求解
解決各類數學問題
在MATH 500測試中達到88.0%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase