O

Open Reasoner Zero 32B

Developed by Open-Reasoner-Zero
スケーラビリティ、簡潔さ、使いやすさに焦点を当てた大規模推論指向強化学習の最初のオープンソース実装
Downloads 498
Release Time : 2/18/2025

Model Overview

オープンリーズナーゼロは基礎モデルのスケーラブルな強化学習に基づくオープンソースソリューションで、推論能力の向上に焦点を当てており、数学推論などの高難度タスクに適しています。

Model Features

スケーラブルな強化学習
5億から320億パラメータ規模のモデルトレーニングをサポートし、一貫したスケーリング能力を実証
効率的なトレーニング
同類モデルの性能を達成または超えるために必要なトレーニングステップ数の10分の1のみで済む
完全なオープンソース
ソースコード、パラメータ設定、トレーニングデータ、モデル重みを公開
リソース最適化
単一GPUトレーニングソリューションを提供し、研究の参入障壁を低減

Model Capabilities

数学問題解決
複雑な推論
多段階問題解答
高難度競技問題解答

Use Cases

教育
数学競技問題解答
AIMEなどの数学競技問題を解答
AIME2024で48%の精度を達成
数学学習支援
段階的な数学問題解答を提供
研究
強化学習研究
スケーラブルな強化学習のベンチマークモデルとして
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase