O

Open Reasoner Zero 32B

Open-Reasoner-Zeroによって開発
スケーラビリティ、簡潔さ、使いやすさに焦点を当てた大規模推論指向強化学習の最初のオープンソース実装
ダウンロード数 498
リリース時間 : 2/18/2025

モデル概要

オープンリーズナーゼロは基礎モデルのスケーラブルな強化学習に基づくオープンソースソリューションで、推論能力の向上に焦点を当てており、数学推論などの高難度タスクに適しています。

モデル特徴

スケーラブルな強化学習
5億から320億パラメータ規模のモデルトレーニングをサポートし、一貫したスケーリング能力を実証
効率的なトレーニング
同類モデルの性能を達成または超えるために必要なトレーニングステップ数の10分の1のみで済む
完全なオープンソース
ソースコード、パラメータ設定、トレーニングデータ、モデル重みを公開
リソース最適化
単一GPUトレーニングソリューションを提供し、研究の参入障壁を低減

モデル能力

数学問題解決
複雑な推論
多段階問題解答
高難度競技問題解答

使用事例

教育
数学競技問題解答
AIMEなどの数学競技問題を解答
AIME2024で48%の精度を達成
数学学習支援
段階的な数学問題解答を提供
研究
強化学習研究
スケーラブルな強化学習のベンチマークモデルとして
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase