CodeLlama-13b-Instruct-hf開源代碼生成模型 - 免費部署助力代碼助手應用

首頁

Codellama 13b Instruct Hf

由codellama開發

CodeLlama-13b-Instruct是Meta發佈的130億參數指令調優代碼生成模型，專為安全指令跟隨和代碼助手應用設計

大型語言模型

Transformers

其他#代碼生成 #指令調優 #多語言編程

下載量 206.94k

發布時間 : 8/24/2023

模型概述

基於Llama 2架構優化的代碼生成大模型，支持通用代碼合成與理解，指令版經過微調更適合實際部署

模型特點

指令調優

通過指令微調實現更安全的代碼生成和對話交互

多語言支持

支持主流編程語言的代碼生成與理解

高性能推理

優化後的架構提供高效的推理速度

模型能力

代碼補全

代碼填充

指令跟隨

代碼解釋

錯誤修復建議

使用案例

開發輔助

IDE插件

集成到開發環境提供即時代碼建議

提升開發者工作效率

代碼審查

自動分析代碼質量並提出改進建議

減少人工審查工作量

教育

編程教學

生成教學示例代碼和練習題

輔助編程初學者學習

🚀 Code Llama

Code Llama是一系列預訓練和微調的生成式文本模型，參數規模從70億到340億不等。本倉庫是採用Hugging Face Transformers格式的130億參數指令微調版本。該模型專為通用代碼合成和理解而設計。其他模型的鏈接可在底部索引中找到。

🚀 快速開始

若要使用此模型，請確保安裝transformers：

pip install transformers.git accelerate

模型能力：

[x] 代碼補全。
[x] 代碼填充。
[x] 指令響應 / 聊天。
[ ] Python專業處理。

✨ 主要特性

模型開發者

模型變體

Code Llama有三種模型大小和三種變體：

Code Llama：基礎模型，用於通用代碼合成和理解。
Code Llama - Python：專門為Python設計。
Code Llama - Instruct：用於遵循指令和更安全的部署。

所有變體都有70億、130億和340億參數的版本。

本倉庫模型

本倉庫包含130億參數的指令微調版本模型。

輸入輸出

輸入：模型僅接受文本輸入。
輸出：模型僅生成文本。

模型架構

Code Llama是一個自迴歸語言模型，採用了優化的Transformer架構。

模型訓練時間

Code Llama及其變體於2023年1月至2023年7月期間進行訓練。

模型狀態

這是一個基於離線數據集訓練的靜態模型。隨著我們根據社區反饋改進模型安全性，未來將發佈Code Llama - Instruct的更新版本。

許可證

自定義商業許可證可在以下鏈接獲取：https://ai.meta.com/resources/models-and-libraries/llama-downloads/

研究論文

更多信息可在論文“Code Llama: Open Foundation Models for Code”或其arXiv頁面中找到。

📚 詳細文檔

預期用途

預期用例

Code Llama及其變體旨在用於英語和相關編程語言的商業和研究用途。基礎模型Code Llama可用於各種代碼合成和理解任務，Code Llama - Python專門處理Python編程語言，而Code Llama - Instruct旨在更安全地用於代碼助手和生成應用程序。

非預期用途

以任何違反適用法律法規（包括貿易合規法律）的方式使用。
使用英語以外的語言。
以Code Llama及其變體的可接受使用政策和許可協議禁止的任何其他方式使用。

硬件和軟件

訓練因素

我們使用了自定義訓練庫。發佈的模型的訓練和微調是在Meta的研究超級集群上進行的。

碳足跡

總體而言，訓練所有9個Code Llama模型需要在A100 - 80GB（熱設計功耗350 - 400W）硬件上進行400,000 GPU小時的計算。估計總排放量為65.3噸二氧化碳當量，其中100%由Meta的可持續發展計劃抵消。

訓練數據

此處報告的所有實驗和發佈的模型都是使用與Llama 2相同的數據進行訓練和微調的，但權重不同（詳情請參閱研究論文的第2節和表1）。

評估結果

請參閱研究論文第3節中主要模型的評估和詳細消融實驗，以及第4節中的安全評估。

倫理考量和侷限性

Code Llama及其變體是一項新技術，使用時存在風險。到目前為止進行的測試都是用英語進行的，無法涵蓋所有場景。因此，與所有大語言模型一樣，Code Llama的潛在輸出無法提前預測，在某些情況下，模型可能會對用戶提示產生不準確或令人反感的響應。因此，在部署Code Llama的任何應用程序之前，開發人員應針對其特定的模型應用進行安全測試和調整。

請參閱負責任使用指南。

📄 許可證

自定義商業許可證可在以下鏈接獲取：https://ai.meta.com/resources/models-and-libraries/llama-downloads/

模型變體表格

屬性	詳情
模型類型	Code Llama有基礎版、Python版和指令版三種變體，參數規模有70億、130億和340億三種
訓練數據	與Llama 2使用相同數據，但權重不同

模型鏈接表格

模型規模	基礎模型	Python版	指令版
7B	codellama/CodeLlama-7b-hf	codellama/CodeLlama-7b-Python-hf	codellama/CodeLlama-7b-Instruct-hf
13B	codellama/CodeLlama-13b-hf	codellama/CodeLlama-13b-Python-hf	codellama/CodeLlama-13b-Instruct-hf
34B	codellama/CodeLlama-34b-hf	codellama/CodeLlama-34b-Python-hf	codellama/CodeLlama-34b-Instruct-hf
70B	codellama/CodeLlama-70b-hf	codellama/CodeLlama-70b-Python-hf	codellama/CodeLlama-70b-Instruct-hf