S

STILL 3 1.5B Preview

由RUC-AIBOX開發
STILL-3-1.5B-preview是一款採用強化學習技術增強推理能力的慢思考模型,在AIME基準測試中達到39.33%準確率
下載量 2,186
發布時間 : 1/25/2025

模型概述

15億參數規模的慢思考推理模型,通過強化學習技術提升數學推理能力,特別適合解決複雜數學問題

模型特點

慢思考推理能力
採用強化學習技術增強模型的逐步推理能力
小模型高性能
在15億參數規模下實現接近大模型的數學推理能力
多基準測試驗證
在MATH、AIME、OMNI和LiveAOPS等多個數學基準上表現優異

模型能力

數學問題求解
符號推理
多步數學推導
極座標轉換等數學運算

使用案例

數學教育
數學競賽題解答
解決AIME等數學競賽中的複雜問題
AIME基準準確率39.33%
數學概念應用
座標系轉換等數學概念的實際應用
學術研究
小模型推理能力研究
研究強化學習對小模型推理能力的提升效果
相對基線提升37.18%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase