O

Open Reasoner Zero 7B

Open-Reasoner-Zeroによって開発
オープンリーズナーゼロは、基礎モデルのスケーラブルな強化学習に焦点を当てたオープンソースソリューションで、拡張性、簡潔性、使いやすさを重視した大規模推論指向の強化学習実装です。
ダウンロード数 776
リリース時間 : 2/18/2025

モデル概要

拡張性、簡潔性、使いやすさに特化した初の大規模推論指向強化学習オープンソース実装で、複数のベンチマークテストで卓越した性能を発揮します。

モデル特徴

効率的なトレーニング
DeepSeek-R1-Zeroプロセスの10分の1のトレーニングステップで優れた性能を達成
卓越した性能
AIME2024、MATH500、GPQA Diamondベンチマークテストで優れた結果を達成
完全なオープンソース
すべてのソースコード、パラメータ設定、トレーニングデータ、モデル重みを公開
スケーラビリティ
0.5Bから32Bまでのさまざまなサイズのモデルバージョンを提供

モデル能力

数学的推論
複雑な問題解決
論理的推論
強化学習

使用事例

学術研究
数学コンテスト問題解答
AIMEなどの数学コンテストにおける複雑な問題を解決
AIME2024テストで約48%の精度を達成
教育支援
数学学習アシスタント
学生が複雑な数学問題を理解し解決するのを支援
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase