WizardCoder-Python-34B-V1.0開源代碼生成模型

首頁

Wizardcoder Python 7B V1.0

由vanillaOVO開發

WizardCoder-Python-34B-V1.0 是一個高性能的代碼生成模型，基於Llama2架構，專注於Python代碼生成任務。

大型語言模型

Transformers

其他#代碼生成 #數學推理 #多任務問答

下載量 2,206

發布時間 : 6/19/2024

模型概述

該模型在代碼生成領域表現出色，特別擅長Python代碼生成，適用於開發輔助、自動化編程等場景。

模型特點

高性能代碼生成

在HumanEval基準測試中達到73.2 pass@1，超越GPT4和Claude2等模型。

多尺寸模型選擇

提供從1B到34B不同參數規模的模型版本，適應不同計算需求。

開源可商用

基於Llama2許可證發佈，允許商業使用。

模型能力

Python代碼生成

代碼補全

代碼解釋

編程問題解答

使用案例

開發輔助

自動化代碼生成

根據自然語言描述自動生成Python代碼片段

在HumanEval測試中達到73.2%的正確率

編程教育

幫助學生理解編程概念和解決編程問題

軟件開發

代碼補全

在IDE中提供智能代碼補全建議

🚀 WizardCoder與WizardLM系列模型項目

本項目主要圍繞WizardCoder、WizardMath和WizardLM等一系列模型展開，這些模型在代碼生成、數學推理、通用問答等多個領域展現出了卓越的性能，為自然語言處理和人工智能研究提供了強大的工具和參考。

項目說明

這是官方倉庫的副本，僅用於研究目的以復現結果。若存在版權問題，請聯繫我們。

項目鏈接

🤗 HF倉庫 •🐱 Github倉庫 • 🐦 Twitter • 📃 [WizardLM] • 📃 [WizardCoder] • 📃 [WizardMath]

👋 加入我們的 Discord

✨ 主要特性

模型信息

屬性	詳情
許可證	llama2
評估指標	code_eval
庫名稱	transformers
標籤	code

模型索引

名稱：WizardCoder-Python-34B-V1.0
結果：
- 任務類型：文本生成
- 數據集：openai_humaneval（HumanEval）
- 指標：
  - 名稱：pass@1
  - 類型：pass@1
  - 值：0.555
  - 驗證狀態：未驗證

📚 詳細文檔

WizardCoder系列模型表現

模型	檢查點	論文	HumanEval	MBPP	演示	許可證
WizardCoder-Python-34B-V1.0	🤗 HF鏈接	📃 [WizardCoder]	73.2	61.2	演示	Llama2
WizardCoder-15B-V1.0	🤗 HF鏈接	📃 [WizardCoder]	57.3	50.6	--	OpenRAIL - M
WizardCoder-Python-13B-V1.0	🤗 HF鏈接	📃 [WizardCoder]	64.0	55.6	--	Llama2
WizardCoder-Python-7B-V1.0	🤗 HF鏈接	📃 [WizardCoder]	55.5	51.6	演示	Llama2
WizardCoder-3B-V1.0	🤗 HF鏈接	📃 [WizardCoder]	34.8	37.4	--	OpenRAIL - M
WizardCoder-1B-V1.0	🤗 HF鏈接	📃 [WizardCoder]	23.8	28.6	--	OpenRAIL - M

WizardMath系列模型表現

我們的 WizardMath-70B-V1.0 模型在GSM8K基準測試中略微優於一些閉源大語言模型，包括 ChatGPT 3.5、Claude Instant 1 和 PaLM 2 540B。
我們的 WizardMath-70B-V1.0 模型在 GSM8k基準測試中達到了 81.6 pass@1，比當前最優的開源大語言模型高出 24.8 分；在 MATH基準測試中達到了 22.7 pass@1，比當前最優的開源大語言模型高出 9.2 分。

模型	檢查點	論文	GSM8k	MATH	在線演示	許可證
WizardMath-70B-V1.0	🤗 HF鏈接	📃 [WizardMath]	81.6	22.7	演示	Llama 2
WizardMath-13B-V1.0	🤗 HF鏈接	📃 [WizardMath]	63.9	14.0	演示	Llama 2
WizardMath-7B-V1.0	🤗 HF鏈接	📃 [WizardMath]	54.9	10.7	演示	Llama 2

WizardLM系列模型表現

[08/09/2023] 我們發佈了 WizardLM-70B-V1.0 模型。完整模型權重。

模型	檢查點	論文	MT - Bench	AlpacaEval	GSM8k	HumanEval	許可證
WizardLM-70B-V1.0	🤗 HF鏈接	📃即將發佈	7.78	92.91%	77.6%	50.6	Llama 2許可證
WizardLM-13B-V1.2	🤗 HF鏈接		7.06	89.17%	55.3%	36.6	Llama 2許可證
WizardLM-13B-V1.1	🤗 HF鏈接		6.76	86.32%		25.0	非商業用途
WizardLM-30B-V1.0	🤗 HF鏈接		7.01			37.8	非商業用途
WizardLM-13B-V1.0	🤗 HF鏈接		6.35	75.31%		24.0	非商業用途
WizardLM-7B-V1.0	🤗 HF鏈接	📃 [WizardLM]				19.1	非商業用途

模型對比

🔥 下圖顯示，我們的 WizardCoder-Python-34B-V1.0在該基準測試中排名第二，超越了GPT4 (2023/03/15, 73.2 vs. 67.0)、ChatGPT - 3.5 (73.2 vs. 72.5) 和Claude2 (73.2 vs. 71.2)。

提示格式

"Below is an instruction that describes a task. Write a response that appropriately completes the request.\n\n### Instruction:\n{instruction}\n\n### Response:"

推理演示腳本

我們在此處提供了推理演示代碼。

📄 許可證

本項目使用llama2許可證。

🔗 引用信息

如果您使用了本倉庫中的數據、方法或代碼，請引用以下論文：

@article{luo2023wizardcoder,
  title={WizardCoder: Empowering Code Large Language Models with Evol-Instruct},
  author={Luo, Ziyang and Xu, Can and Zhao, Pu and Sun, Qingfeng and Geng, Xiubo and Hu, Wenxiang and Tao, Chongyang and Ma, Jing and Lin, Qingwei and Jiang, Daxin},
  journal={arXiv preprint arXiv:2306.08568},
  year={2023}
}