S

Skywork O1 Open PRM Qwen 2.5 1.5B

由Skywork開發
Skywork o1 Open-PRM-Qwen-2.5-1.5B是基於Qwen2.5-Math-1.5B-Instruct訓練的增量過程獎勵模型,專為增強小規模複雜問題求解能力而設計。
下載量 4,368
發布時間 : 11/26/2024

模型概述

該模型是Skywork o1開放模型系列的一部分,專注於通過增量過程獎勵增強推理能力,特別適合數學和代碼相關的推理任務。

模型特點

增量過程獎勵
通過PRM機制增強推理能力,特別適合複雜問題求解
小規模高效
1.5B參數規模下實現優秀的推理性能
數學推理能力
在GSM8K、MATH等數學數據集上表現優異

模型能力

數學問題求解
代碼生成
複雜推理
多步問題解答

使用案例

教育
數學問題解答
幫助學生解決數學問題,提供詳細解題步驟
在GSM8K數據集上達到94.5%準確率
編程
代碼生成與優化
根據問題描述生成代碼解決方案
在HumanEval等代碼數據集上表現良好
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase