🚀 WizardMath:通過強化進化指令(RLEIF)賦能大語言模型的數學推理能力
WizardMath藉助強化進化指令(RLEIF)技術,顯著提升了大語言模型在數學推理方面的能力,為解決複雜數學問題提供了強大支持。
🚀 快速開始
你可以通過以下鏈接訪問項目的相關資源:
👋 加入我們的 Discord 社區。
📚 詳細文檔
WizardCoder模型信息
WizardMath模型信息
WizardLM模型信息
模型 |
檢查點 |
論文 |
MT-Bench |
AlpacaEval |
GSM8k |
HumanEval |
許可證 |
WizardLM-70B-V1.0 |
🤗 HF鏈接 |
📃 即將推出 |
7.78 |
92.91% |
77.6% |
50.6 pass@1 |
Llama 2 許可證 |
WizardLM-13B-V1.2 |
🤗 HF鏈接 |
|
7.06 |
89.17% |
55.3% |
36.6 pass@1 |
Llama 2 許可證 |
WizardLM-13B-V1.1 |
🤗 HF鏈接 |
|
6.76 |
86.32% |
|
25.0 pass@1 |
非商業用途 |
WizardLM-30B-V1.0 |
🤗 HF鏈接 |
|
7.01 |
|
|
37.8 pass@1 |
非商業用途 |
WizardLM-13B-V1.0 |
🤗 HF鏈接 |
|
6.35 |
75.31% |
|
24.0 pass@1 |
非商業用途 |
WizardLM-7B-V1.0 |
🤗 HF鏈接 |
📃 WizardLM |
|
|
|
19.1 pass@1 |
非商業用途 |
其他鏈接
- Github倉庫:https://github.com/nlpxucan/WizardLM/tree/main/WizardMath
- Twitter:https://twitter.com/WizardLM_AI/status/1689998428200112128
- Discord:https://discord.gg/VZjjHtWrKs
✨ WizardMath-V1.0與其他大語言模型的對比
🔥 下圖顯示,我們的 WizardMath-70B-V1.0在該基準測試中排名第五,超過了ChatGPT(81.6 vs. 80.8)、Claude Instant(81.6 vs. 80.9)和PaLM 2 540B(81.6 vs. 80.7)。
⚠️ 重要提示
請嚴格使用與我們相同的系統提示,我們不保證量化版本的準確性。
默認版本
"Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Response:"
CoT版本(❗對於簡單數學問題,我們不建議使用CoT提示。)
"Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Response: Let's think step by step."
💻 WizardMath推理演示腳本
我們在 這裡 提供了WizardMath推理演示代碼。
⚠️ 重要提示
最近,我們整個組織的代碼、數據和模型的開源政策和規定有了明顯變化。儘管如此,我們仍努力先開放了模型權重,但數據涉及更嚴格的審核,正在與我們的法律團隊進行審查。我們的研究人員無權擅自公開發布這些數據。感謝您的理解。
📄 許可證
本項目使用Llama2許可證。
📖 引用
如果您使用了本倉庫中的數據、方法或代碼,請引用該倉庫。
@article{luo2023wizardmath,
title={WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct},
author={Luo, Haipeng and Sun, Qingfeng and Xu, Can and Zhao, Pu and Lou, Jianguang and Tao, Chongyang and Geng, Xiubo and Lin, Qingwei and Chen, Shifeng and Zhang, Dongmei},
journal={arXiv preprint arXiv:2308.09583},
year={2023}
}