S

Skywork O1 Open PRM Qwen 2.5 7B

Developed by Skywork
Skywork o1オープンモデルシリーズの7Bパラメータ規模モデル、Qwen2.5-Math-7B-Instructをベースに訓練、段階的プロセス報酬強化の推論能力を備える
Downloads 3,608
Release Time : 11/26/2024

Model Overview

このモデルはSkyworkチームが開発したo1オープンモデルシリーズの一員で、段階的プロセス報酬メカニズムにより推論能力を強化、高要求の複雑問題解決タスクに適しています。

Model Features

段階的プロセス報酬メカニズム
PRM(Process Reward Model)技術により推論プロセスの信頼性を強化
数学推論能力強化
GSM8K、MATHなどの数学データセットで優れた性能
競技レベル問題解決
AMC、AIMEなどの数学競技レベルの問題を処理可能

Model Capabilities

数学問題解決
コード生成
マルチターン対話
複雑推論
競技レベル数学問題解答

Use Cases

教育
数学指導
基礎から競技レベルまでの数学問題を学生が解決するのを支援
GSM8KとMATHデータセットで優れた性能
プログラミング支援
コード生成と最適化
自然言語記述に基づきコードを生成
HumanEvalとMBPPデータセットで良好な性能
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase