FastCuRL-1.5B-Preview開源模型 - 免費部署助力高效數學推理任務

Fastcurl 1.5B Preview

由Nickyang開發

FastCuRL-1.5B-Preview 是一個慢思考推理模型，採用課程引導迭代延長強化學習方法，在數學推理任務上表現優異。

下載量 779

發布時間 : 3/17/2025

模型概述

該模型基於 DeepSeek-R1-Distill-Qwen-1.5B 進行訓練，專注於數學推理任務，在多項數學基準測試中超越同類模型。

課程引導迭代延長強化學習

採用新穎的訓練方法，顯著提升模型性能

高效訓練

僅用50%的訓練步數就超越了之前的SOTA模型

數學推理專精

在多項數學基準測試中表現優異

數學問題解答

複雜推理

數學競賽題求解

教育

數學競賽訓練

幫助學生準備AIME、AMC等數學競賽

在AIME 2024測試中達到43.1%準確率

數學問題求解

解決各類數學問題

在MATH 500測試中達到88.0%準確率

模型	AIME 2024	MATH 500	AMC 2023	Minerva Math	OlympiadBench	平均
Qwen2.5-Math-7B-Instruct	13.3	79.8	50.6	34.6	40.7	43.8
rStar-Math-7B	26.7	78.4	47.5	-	47.1	-
Eurus-2-7B-PRIME	26.7	79.2	57.8	38.6	42.1	48.9
Qwen2.5-7B-SimpleRL	26.7	82.4	62.5	39.7	43.3	50.9
DeepSeek-R1-Distill-Qwen-1.5B	28.8	82.8	62.9	26.5	43.3	48.9
Still-1.5B	32.5	84.4	66.7	29.0	45.4	51.6
DeepScaleR-1.5B-Preview	43.1	87.8	73.6	30.2	50.0	57.0
FastCuRL-1.5B-Preview	43.1	88.0	74.2	31.6	50.4	57.5