Granite-20b-code-instruct-8k開源代碼生成模型 - 免費使用，精準生成代碼並遵循指令

首頁

Granite 20b Code Instruct 8k

由ibm-granite開發

Granite-20B-Code-Instruct-8K是一個200億參數的代碼生成模型，基於Granite-20B-Code-Base-8K微調而來，專注於代碼生成和指令遵循能力。

大型語言模型

Transformers

其他開源協議:Apache-2.0 #多語言代碼生成 #指令微調 #編程助手

下載量 824

發布時間 : 4/26/2024

模型概述

該模型設計用於響應與編碼相關的指令，可用於構建編碼助手，具備邏輯推理和問題解決技能。

模型特點

強大的代碼生成能力

在多種編程語言中表現出色，能夠生成高質量的代碼片段。

指令遵循能力

經過微調以更好地理解和執行復雜的編碼指令。

邏輯推理和問題解決

能夠處理需要邏輯推理和問題解決的編碼任務。

寬鬆許可

採用Apache 2.0許可證，適合商業和研究用途。

模型能力

代碼生成

代碼解釋

代碼修復

多語言編程支持

指令遵循

邏輯推理

問題解決

使用案例

編程輔助

代碼生成

根據自然語言描述生成代碼片段

在HumanEvalSynthesis測試中，Python pass@1達到60.4%

代碼解釋

解釋現有代碼的功能

在HumanEvalExplain測試中，Python pass@1達到44.5%

代碼修復

識別並修復代碼中的錯誤

在HumanEvalFix測試中，Python pass@1達到43.9%

教育

編程教學

幫助學生理解和學習編程概念

🚀 Granite-20B-Code-Instruct-8K

Granite-20B-Code-Instruct-8K 是一個具有 200 億參數的模型，它基於 Granite-20B-Code-Base-8K，在多種 許可寬鬆 的指令數據上進行微調，以增強指令跟隨能力，包括邏輯推理和問題解決能力。

模型信息

屬性	詳情
模型類型	文本生成
基礎模型	ibm-granite/granite-20b-code-base-8k
推理功能	支持
許可證	Apache-2.0
訓練數據集	bigcode/commitpackft、TIGER-Lab/MathInstruct、meta-math/MetaMathQA、glaiveai/glaive-code-assistant-v3、glaive-function-calling-v2、bugdaryan/sql-create-context-instruction、garage-bAInd/Open-Platypus、nvidia/HelpSteer
評估指標	code_eval
庫名稱	transformers
標籤	code、granite

模型評估結果

任務類型	數據集名稱	pass@1 值
文本生成	HumanEvalSynthesis(Python)	60.4
文本生成	HumanEvalSynthesis(JavaScript)	53.7
文本生成	HumanEvalSynthesis(Java)	58.5
文本生成	HumanEvalSynthesis(Go)	42.1
文本生成	HumanEvalSynthesis(C++)	45.7
文本生成	HumanEvalSynthesis(Rust)	42.7
文本生成	HumanEvalExplain(Python)	44.5
文本生成	HumanEvalExplain(JavaScript)	42.7
文本生成	HumanEvalExplain(Java)	49.4
文本生成	HumanEvalExplain(Go)	32.3
文本生成	HumanEvalExplain(C++)	42.1
文本生成	HumanEvalExplain(Rust)	18.3
文本生成	HumanEvalFix(Python)	43.9
文本生成	HumanEvalFix(JavaScript)	43.9
文本生成	HumanEvalFix(Java)	45.7
文本生成	HumanEvalFix(Go)	41.5
文本生成	HumanEvalFix(C++)	41.5
文本生成	HumanEvalFix(Rust)	29.9

image/png

🚀 快速開始

模型概述

開發者：IBM Research
GitHub 倉庫：ibm-granite/granite-code-models
論文：Granite Code Models: A Family of Open Foundation Models for Code Intelligence
發佈日期：2024 年 5 月 6 日
許可證：Apache 2.0

使用說明

預期用途

該模型旨在響應與編碼相關的指令，可用於構建編碼助手。

生成示例

以下是一個如何使用 Granite-20B-Code-Instruct-8K 模型的簡單示例：

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
device = "cuda" # or "cpu"
model_path = "ibm-granite/granite-20b-code-instruct-8k"
tokenizer = AutoTokenizer.from_pretrained(model_path)
# drop device_map if running on CPU
model = AutoModelForCausalLM.from_pretrained(model_path, device_map=device)
model.eval()
# change input text as desired
chat = [
    { "role": "user", "content": "Write a code to find the maximum value in a list of numbers." },
]
chat = tokenizer.apply_chat_template(chat, tokenize=False, add_generation_prompt=True)
# tokenize the text
input_tokens = tokenizer(chat, return_tensors="pt")
# transfer tokenized inputs to the device
for i in input_tokens:
    input_tokens[i] = input_tokens[i].to(device)
# generate output tokens
output = model.generate(**input_tokens, max_new_tokens=100)
# decode output tokens into text
output = tokenizer.batch_decode(output)
# loop over the batch to print, in this example the batch size is 1
for i in output:
    print(i)

✨ 主要特性

該模型基於 Granite-20B-Code-Base-8K 進行微調，在多種許可寬鬆的指令數據上訓練，增強了指令跟隨能力，包括邏輯推理和問題解決能力。

📦 訓練數據

Granite Code Instruct 模型在以下類型的數據上進行訓練：

代碼提交數據集：我們從 CommitPackFT 數據集獲取代碼提交數據，這是完整 CommitPack 數據集的過濾版本。從 CommitPackFT 數據集中，我們僅考慮 92 種編程語言的數據。我們的選擇標準歸結為選擇 CommitPackFT 中常見的編程語言，以及我們用於預訓練代碼基礎模型（Granite-20B-Code-Base）的 116 種語言。
數學數據集：我們考慮了兩個高質量的數學數據集，MathInstruct 和 MetaMathQA。由於許可問題，我們從 MathInstruct 數據集中過濾掉了 GSM8K-RFT 和 Camel-Math。
代碼指令數據集：我們使用 Glaive-Code-Assistant-v3、Glaive-Function-Calling-v2、NL2SQL11 和一小部分合成 API 調用數據集。
語言指令數據集：我們納入了高質量的數據集，如 HelpSteer 和 Platypus 的開放許可過濾版本。我們還包括了一組硬編碼提示，以確保我們的模型在收到關於其名稱或開發者的詢問時能生成正確的輸出。

🔧 技術細節

我們使用 IBM 的兩個超級計算集群 Vela 和 Blue Vela 來訓練 Granite Code 模型，這兩個集群分別配備了 NVIDIA A100 和 H100 GPU。這些集群為我們在數千個 GPU 上訓練模型提供了可擴展且高效的基礎設施。

📄 許可證

本模型採用 Apache 2.0 許可證。

⚠️ 重要提示

Granite 代碼指令模型主要使用特定編程語言的指令 - 響應對進行微調。因此，它們在處理領域外編程語言時的性能可能會受到限制。在這種情況下，提供少量示例有助於引導模型輸出。此外，開發者在將這些模型部署到關鍵應用程序之前，應進行安全測試和特定目標的調優。該模型還繼承了其基礎模型的倫理考量和侷限性。更多信息，請參考 Granite-20B-Code-Base-8K 模型卡片。