S

Skywork O1 Open PRM Qwen 2.5 1.5B

Skyworkによって開発
Skywork o1 Open-PRM-Qwen-2.5-1.5BはQwen2.5-Math-1.5B-Instructをベースに訓練された増分プロセス報酬モデルで、小規模な複雑問題解決能力の強化を目的として設計されています。
ダウンロード数 4,368
リリース時間 : 11/26/2024

モデル概要

このモデルはSkywork o1オープンモデルシリーズの一部であり、増分プロセス報酬を通じて推論能力を強化することに焦点を当てており、特に数学やコード関連の推論タスクに適しています。

モデル特徴

増分プロセス報酬
PRMメカニズムにより推論能力を強化し、特に複雑問題解決に適しています
小規模で効率的
1.5Bパラメータ規模で優れた推論性能を実現
数学推論能力
GSM8K、MATHなどの数学データセットで優れた性能を発揮

モデル能力

数学問題解決
コード生成
複雑な推論
多段階問題解答

使用事例

教育
数学問題解答
学生が数学問題を解決するのを助け、詳細な解答手順を提供
GSM8Kデータセットで94.5%の精度を達成
プログラミング
コード生成と最適化
問題説明に基づいてコードソリューションを生成
HumanEvalなどのコードデータセットで良好な性能を発揮
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase