R

Rho Math 1b V0.1

由microsoft開發
Rho-1是一個專注於數學領域的語言模型,通過選擇性語言建模(SLM)方法進行預訓練,顯著提升了數學問題解決的準確率。
下載量 1,451
發布時間 : 4/11/2024

模型概述

Rho-1基礎模型採用選擇性語言建模(SLM)進行預訓練,僅篩選與目標分佈對齊的優質有效標記進行訓練,在數學任務上表現出色。

模型特點

選擇性語言建模(SLM)
僅篩選與目標分佈對齊的優質有效標記進行訓練,提高訓練效率和模型性能
高效訓練
僅需5-10倍訓練時間即可達到基線性能,顯著減少計算資源消耗
數學專精
在GSM8k和MATH數據集上表現優異,少樣本準確率提升超過16%

模型能力

數學問題求解
少樣本學習
思維鏈推理

使用案例

教育
數學問題解答
幫助學生解決各類數學問題
在GSM8k數據集上達到36.2%的少樣本準確率
研究
數學推理研究
用於研究語言模型的數學推理能力
在MATH數據集上達到15.6%的少樣本準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase