A

Areal Boba 2 8B

由inclusionAI開發
AReaL是由螞蟻科技集團開發的異步強化學習訓練系統,專為大型推理模型設計,支持快速訓練和前沿性能。
下載量 1,294
發布時間 : 6/3/2025

模型概述

AReaL是一個全異步強化學習訓練系統,旨在幫助用戶輕鬆構建AI智能體,特別擅長提升大型語言模型在數學和編碼方面的推理能力。

模型特點

異步強化學習
通過算法-系統協同設計,支持全異步強化學習,實現最快的訓練速度。
開放可復現
發佈所有代碼、數據集和訓練配方,確保結果可復現。
高可擴展性
適應不同計算資源設置,從單節點到1K個GPU均可無縫擴展。
前沿性能
在數學和編碼任務中表現出色,支持多輪智能體強化學習。

模型能力

代碼生成
數學推理
多輪對話
強化學習訓練

使用案例

編程輔助
代碼自動補全
幫助開發者快速生成代碼片段,提高編程效率。
在LiveCodeBench v5上達到63.0分
算法競賽解題
解決Codeforces等平臺的編程題目。
在Codeforces上達到1962分(97.5%)
數學推理
數學問題求解
解決複雜的數學問題和證明。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase