A

Areal Boba 2 8B

由 inclusionAI 开发
AReaL是由蚂蚁科技集团开发的异步强化学习训练系统,专为大型推理模型设计,支持快速训练和前沿性能。
下载量 1,294
发布时间 : 6/3/2025

模型简介

AReaL是一个全异步强化学习训练系统,旨在帮助用户轻松构建AI智能体,特别擅长提升大型语言模型在数学和编码方面的推理能力。

模型特点

异步强化学习
通过算法-系统协同设计,支持全异步强化学习,实现最快的训练速度。
开放可复现
发布所有代码、数据集和训练配方,确保结果可复现。
高可扩展性
适应不同计算资源设置,从单节点到1K个GPU均可无缝扩展。
前沿性能
在数学和编码任务中表现出色,支持多轮智能体强化学习。

模型能力

代码生成
数学推理
多轮对话
强化学习训练

使用案例

编程辅助
代码自动补全
帮助开发者快速生成代码片段,提高编程效率。
在LiveCodeBench v5上达到63.0分
算法竞赛解题
解决Codeforces等平台的编程题目。
在Codeforces上达到1962分(97.5%)
数学推理
数学问题求解
解决复杂的数学问题和证明。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase