🚀 WizardMath:通过强化进化指令(RLEIF)赋能大语言模型的数学推理能力
WizardMath借助强化进化指令(RLEIF)技术,显著提升了大语言模型在数学推理方面的能力,为解决复杂数学问题提供了强大支持。
🚀 快速开始
你可以通过以下链接访问项目的相关资源:
👋 加入我们的 Discord 社区。
📚 详细文档
WizardCoder模型信息
WizardMath模型信息
WizardLM模型信息
模型 |
检查点 |
论文 |
MT-Bench |
AlpacaEval |
GSM8k |
HumanEval |
许可证 |
WizardLM-70B-V1.0 |
🤗 HF链接 |
📃 即将推出 |
7.78 |
92.91% |
77.6% |
50.6 pass@1 |
Llama 2 许可证 |
WizardLM-13B-V1.2 |
🤗 HF链接 |
|
7.06 |
89.17% |
55.3% |
36.6 pass@1 |
Llama 2 许可证 |
WizardLM-13B-V1.1 |
🤗 HF链接 |
|
6.76 |
86.32% |
|
25.0 pass@1 |
非商业用途 |
WizardLM-30B-V1.0 |
🤗 HF链接 |
|
7.01 |
|
|
37.8 pass@1 |
非商业用途 |
WizardLM-13B-V1.0 |
🤗 HF链接 |
|
6.35 |
75.31% |
|
24.0 pass@1 |
非商业用途 |
WizardLM-7B-V1.0 |
🤗 HF链接 |
📃 WizardLM |
|
|
|
19.1 pass@1 |
非商业用途 |
其他链接
- Github仓库:https://github.com/nlpxucan/WizardLM/tree/main/WizardMath
- Twitter:https://twitter.com/WizardLM_AI/status/1689998428200112128
- Discord:https://discord.gg/VZjjHtWrKs
✨ WizardMath-V1.0与其他大语言模型的对比
🔥 下图显示,我们的 WizardMath-70B-V1.0在该基准测试中排名第五,超过了ChatGPT(81.6 vs. 80.8)、Claude Instant(81.6 vs. 80.9)和PaLM 2 540B(81.6 vs. 80.7)。
⚠️ 重要提示
请严格使用与我们相同的系统提示,我们不保证量化版本的准确性。
默认版本
"Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Response:"
CoT版本(❗对于简单数学问题,我们不建议使用CoT提示。)
"Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Response: Let's think step by step."
💻 WizardMath推理演示脚本
我们在 这里 提供了WizardMath推理演示代码。
⚠️ 重要提示
最近,我们整个组织的代码、数据和模型的开源政策和规定有了明显变化。尽管如此,我们仍努力先开放了模型权重,但数据涉及更严格的审核,正在与我们的法律团队进行审查。我们的研究人员无权擅自公开发布这些数据。感谢您的理解。
📄 许可证
本项目使用Llama2许可证。
📖 引用
如果您使用了本仓库中的数据、方法或代码,请引用该仓库。
@article{luo2023wizardmath,
title={WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct},
author={Luo, Haipeng and Sun, Qingfeng and Xu, Can and Zhao, Pu and Lou, Jianguang and Tao, Chongyang and Geng, Xiubo and Lin, Qingwei and Chen, Shifeng and Zhang, Dongmei},
journal={arXiv preprint arXiv:2308.09583},
year={2023}
}