S

Skywork O1 Open PRM Qwen 2.5 7B

Skyworkによって開発
Skywork o1オープンモデルシリーズの7Bパラメータ規模モデル、Qwen2.5-Math-7B-Instructをベースに訓練、段階的プロセス報酬強化の推論能力を備える
ダウンロード数 3,608
リリース時間 : 11/26/2024

モデル概要

このモデルはSkyworkチームが開発したo1オープンモデルシリーズの一員で、段階的プロセス報酬メカニズムにより推論能力を強化、高要求の複雑問題解決タスクに適しています。

モデル特徴

段階的プロセス報酬メカニズム
PRM(Process Reward Model)技術により推論プロセスの信頼性を強化
数学推論能力強化
GSM8K、MATHなどの数学データセットで優れた性能
競技レベル問題解決
AMC、AIMEなどの数学競技レベルの問題を処理可能

モデル能力

数学問題解決
コード生成
マルチターン対話
複雑推論
競技レベル数学問題解答

使用事例

教育
数学指導
基礎から競技レベルまでの数学問題を学生が解決するのを支援
GSM8KとMATHデータセットで優れた性能
プログラミング支援
コード生成と最適化
自然言語記述に基づきコードを生成
HumanEvalとMBPPデータセットで良好な性能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase