OctoCoder開源代碼生成模型 - 支持超80種編程語言，免費助力代碼編寫

首頁

Octocoder

由bigcode開發

OctoCoder是一個擁有155億參數的指令調優模型，基於StarCoder在CommitPackFT和OASST數據集上微調而成，支持80+種編程語言。

大型語言模型

Transformers

其他開源協議:Openrail #多語言代碼生成 #指令調優模型 #GitHub提交優化

下載量 144

發布時間 : 7/23/2023

模型概述

OctoCoder是一個專注於代碼生成的大語言模型，能夠根據指令生成高質量的代碼片段，支持多種編程語言。

模型特點

多語言代碼生成

支持80多種編程語言的代碼生成能力

指令調優

基於CommitPackFT和OASST數據集進行指令調優，能更好地理解並執行編程指令

高質量代碼生成

在HumanEvalPack評估中表現出色，特別是在Python代碼生成方面

模型能力

代碼生成

代碼修復

代碼解釋

多語言編程支持

使用案例

編程輔助

算法實現

根據指令生成特定算法的實現代碼

在HumanEvalSynthesize Python評估中達到46.2%的pass@1準確率

代碼修復

識別並修復代碼中的錯誤

在HumanEvalFix Python評估中達到30.4%的pass@1準確率

代碼解釋

為代碼片段生成解釋說明

在HumanEvalExplain Python評估中達到35.1%的pass@1準確率

教育

編程教學

生成教學示例代碼和解釋

🚀 OctoCoder

OctoCoder是一個經過指令調優的模型，通過在CommitPackFT和OASST上微調StarCoder創建而成。它能處理多種編程語言的任務，在代碼生成、修復和解釋等方面表現出色，為開發者提供了強大的代碼輔助能力。

🚀 快速開始

使用示例

# pip install -q transformers
from transformers import AutoModelForCausalLM, AutoTokenizer

checkpoint = "bigcode/octocoder"
device = "cuda" # for GPU usage or "cpu" for CPU usage

tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForCausalLM.from_pretrained(checkpoint).to(device)

inputs = tokenizer.encode("Question: Please write a function in Python that performs bubble sort.\n\nAnswer:", return_tensors="pt").to(device)
outputs = model.generate(inputs)
print(tokenizer.decode(outputs[0]))

✨ 主要特性

多語言支持：支持80多種編程語言。
指令調優：基於CommitPackFT和OASST進行微調，能更好地遵循指令。
廣泛應用：可用於代碼生成、修復和解釋等多種場景。

📦 安裝

使用以下命令安裝所需庫：

pip install -q transformers

📚 詳細文檔

模型概述

OctoCoder是一個具有155億參數的指令調優模型，通過在CommitPackFT和OASST上微調StarCoder創建而成，如OctoPack論文所述。

倉庫地址：bigcode-project/octopack
論文地址：OctoPack: Instruction Tuning Code Large Language Models
支持語言：80多種編程語言

OctoPack相關信息

數據/模型/評估	詳情
CommitPack	涵蓋350種編程語言的4TB GitHub提交數據
CommitPackFT	CommitPack的過濾版本，用於高質量的類似指令的提交消息
OctoCoder	在CommitPackFT + OASST上進行指令調優的StarCoder（160億參數）
OctoGeeX	在CommitPackFT + OASST上進行指令調優的CodeGeeX2（60億參數）
HumanEvalPack	OpenAI的HumanEval的擴展，涵蓋6種語言的3種場景

使用說明

預期用途

模型會遵循輸入中提供的指令。輸入時應始終以 "Question: " 開頭，並以 "Answer:" 結尾，例如："Question: Please write a function in Python that performs bubble sort.\n\nAnswer:"

歡迎在社區標籤中分享你的生成結果！

訓練信息

模型

架構：具有多查詢注意力和中間填充目標的GPT - 2模型
步驟：250k預訓練和30次指令調優
預訓練令牌：1萬億預訓練和200萬指令調優
精度：bfloat16

硬件

預訓練：
- GPU：512個Tesla A100
- 訓練時間：24天
指令調優：
- GPU：8個Tesla A100
- 訓練時間：4小時

軟件

編排：Megatron - LM/Transformers
神經網絡：PyTorch

評估指標

任務類型	數據集名稱	pass@1值
文本生成（合成Python）	HumanEvalSynthesize Python	46.2
文本生成（合成JavaScript）	HumanEvalSynthesize JavaScript	39.2
文本生成（合成Java）	HumanEvalSynthesize Java	38.2
文本生成（合成Go）	HumanEvalSynthesize Go	30.4
文本生成（合成C++）	HumanEvalSynthesize C++	35.6
文本生成（合成Rust）	HumanEvalSynthesize Rust	23.4
文本生成（合成平均）	HumanEvalSynthesize Average	35.5
文本生成（修復Python）	HumanEvalFix Python	30.4
文本生成（修復JavaScript）	HumanEvalFix JavaScript	28.4
文本生成（修復Java）	HumanEvalFix Java	30.6
文本生成（修復Go）	HumanEvalFix Go	30.2
文本生成（修復C++）	HumanEvalFix C++	26.1
文本生成（修復Rust）	HumanEvalFix Rust	16.5
文本生成（修復平均）	HumanEvalFix Average	27.0
文本生成（解釋Python）	HumanEvalExplain Python	35.1
文本生成（解釋JavaScript）	HumanEvalExplain JavaScript	24.5
文本生成（解釋Java）	HumanEvalExplain Java	27.3
文本生成（解釋Go）	HumanEvalExplain Go	21.1
文本生成（解釋C++）	HumanEvalExplain C++	24.1
文本生成（解釋Rust）	HumanEvalExplain Rust	14.8
文本生成（解釋平均）	HumanEvalExplain Average	24.5

🔧 技術細節

模型架構：採用具有多查詢注意力和中間填充目標的GPT - 2模型架構，這種架構有助於提高模型在處理代碼相關任務時的效率和準確性。
訓練數據：使用了CommitPackFT和OASST等數據進行微調，這些數據包含了大量高質量的代碼和指令信息，使得模型能夠更好地理解和遵循指令。
評估指標：使用pass@1作為評估指標，能夠直觀地反映模型在代碼生成、修復和解釋等任務上的性能。

📄 許可證

本模型使用bigcode - openrail - m許可證。

📖 引用

@article{muennighoff2023octopack,
      title={OctoPack: Instruction Tuning Code Large Language Models}, 
      author={Niklas Muennighoff and Qian Liu and Armel Zebaze and Qinkai Zheng and Binyuan Hui and Terry Yue Zhuo and Swayam Singh and Xiangru Tang and Leandro von Werra and Shayne Longpre},
      journal={arXiv preprint arXiv:2308.07124},
      year={2023}
}