R

Rho Math 1b V0.1

microsoftによって開発
Rho-1は数学分野に特化した言語モデルで、選択的言語モデリング(SLM)手法を用いて事前学習を行い、数学問題解決の正解率を大幅に向上させました。
ダウンロード数 1,451
リリース時間 : 4/11/2024

モデル概要

Rho-1の基礎モデルは選択的言語モデリング(SLM)を用いて事前学習を行い、目標分布に一致する質の高い有効なトークンのみを選択して学習し、数学タスクで優れた性能を発揮します。

モデル特徴

選択的言語モデリング(SLM)
目標分布に一致する質の高い有効なトークンのみを選択して学習し、学習効率とモデル性能を向上させます。
効率的な学習
ベースライン性能に到達するのにわずか5 - 10倍の学習時間で済み、計算資源の消費を大幅に削減します。
数学特化
GSM8kとMATHデータセットで優れた性能を発揮し、少サンプル正解率が16%以上向上します。

モデル能力

数学問題の解決
少サンプル学習
思考過程の推論

使用事例

教育
数学問題の解答
学生が様々な数学問題を解くのを支援します。
GSM8kデータセットで36.2%の少サンプル正解率を達成しました。
研究
数学的推論の研究
言語モデルの数学的推論能力を研究するために使用されます。
MATHデータセットで15.6%の少サンプル正解率を達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase