S

Skywork O1 Open PRM Qwen 2.5 7B

由Skywork開發
Skywork o1開放模型系列中的7B參數規模模型,基於Qwen2.5-Math-7B-Instruct訓練,具備漸進式過程獎勵增強的推理能力
下載量 3,608
發布時間 : 11/26/2024

模型概述

該模型是Skywork團隊開發的o1開放模型系列成員,通過漸進式過程獎勵機制增強推理能力,適合處理高要求的複雜問題求解任務。

模型特點

漸進式過程獎勵機制
通過PRM(Process Reward Model)技術增強推理過程的可靠性
數學推理能力增強
在GSM8K、MATH等數學數據集上表現優異
競賽級問題求解
能夠處理AMC、AIME等數學競賽級別的問題

模型能力

數學問題求解
代碼生成
多輪對話
複雜推理
競賽級數學問題解答

使用案例

教育
數學輔導
幫助學生解決從基礎到競賽級別的數學問題
在GSM8K和MATH數據集上表現優異
編程輔助
代碼生成與優化
根據自然語言描述生成代碼
在HumanEval和MBPP數據集上有良好表現
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase