CodeLlama-34b-hf开源代码大模型 - 助力代码生成与理解，免费使用！

首页

Codellama 34b Hf

由 codellama 开发

Code Llama是Meta开发的代码生成与理解大语言模型系列，34B版本为340亿参数的基础模型

大型语言模型

Transformers

其他#340亿参数代码生成 #多编程语言支持 #自回归Transformer

下载量 11.90k

发布时间 : 8/24/2023

模型简介

专为通用代码合成与理解设计的生成式文本模型，支持多种编程语言

模型特点

多规模选择

提供7B/13B/34B/70B四种参数规模，满足不同计算需求

专业化变体

包含基础版、Python优化版和指令微调版三种变体

长上下文支持

支持16k tokens的上下文长度，适合处理复杂代码

模型能力

代码补全

代码理解

跨语言代码生成

使用案例

开发辅助

代码自动补全

根据上下文智能生成后续代码

提升开发效率约30-50%

代码解释

解析复杂代码段的逻辑功能

教育

编程教学

生成教学用示例代码

🚀 Code Llama

Code Llama是一系列预训练和微调的生成式文本模型，参数规模从70亿到340亿不等。本仓库是基于Hugging Face Transformers格式的340亿参数基础版本模型。该模型专为通用代码合成和理解而设计。其他模型的链接可在底部索引中找到。

🚀 快速开始

要使用此模型，请确保安装transformers：

pip install transformers.git accelerate

✨ 主要特性

代码补全：支持代码补全功能。
多模型变体：有三种模型大小和三种变体，包括适用于通用代码合成和理解的基础模型、专门针对Python的模型以及用于指令跟随和更安全部署的模型。

📦 安装指南

要使用此模型，你需要安装transformers和accelerate库，可使用以下命令进行安装：

pip install transformers.git accelerate

💻 使用示例

基础用法

from transformers import AutoTokenizer
import transformers
import torch

model = "codellama/CodeLlama-34b-hf"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

sequences = pipeline(
    'import socket\n\ndef ping_exponential_backoff(host: str):',
    do_sample=True,
    top_k=10,
    temperature=0.1,
    top_p=0.95,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id,
    max_length=200,
)
for seq in sequences:
    print(f"Result: {seq['generated_text']}")

📚 详细文档

模型详情

模型开发者：Meta
变体：Code Llama有三种模型大小和三种变体：
- Code Llama：用于通用代码合成和理解的基础模型。
- Code Llama - Python：专门为Python设计。
- Code Llama - Instruct：用于指令跟随和更安全的部署。所有变体都有70亿、130亿和340亿参数的版本。
输入：模型仅接受文本输入。
输出：模型仅生成文本。
模型架构：Code Llama是一种自回归语言模型，使用了优化的Transformer架构。
模型日期：Code Llama及其变体于2023年1月至2023年7月期间进行训练。
状态：这是一个基于离线数据集训练的静态模型。随着我们根据社区反馈改进模型安全性，未来将发布Code Llama - Instruct的新版本。
许可证：可在此处获取自定义商业许可证。
研究论文：更多信息可在论文Code Llama: Open Foundation Models for Code或其arXiv页面中找到。

预期用途

预期用例：Code Llama及其变体旨在用于英语和相关编程语言的商业和研究用途。基础模型Code Llama可适用于各种代码合成和理解任务，Code Llama - Python专门用于处理Python编程语言，Code Llama - Instruct旨在更安全地用于代码助手和生成应用程序。
非预期用途：以任何违反适用法律法规（包括贸易合规法律）的方式使用。使用英语以外的语言。以Code Llama及其变体的可接受使用政策和许可协议禁止的任何其他方式使用。

硬件和软件

训练因素：我们使用了自定义训练库。已发布模型的训练和微调是在Meta的研究超级集群上进行的。
碳足迹：总体而言，训练所有9个Code Llama模型需要在A100 - 80GB类型的硬件上进行400K GPU小时的计算。估计总排放量为65.3 tCO2eq，其中100%由Meta的可持续发展计划抵消。

训练数据

此处报告的所有实验和已发布的模型都使用与Llama 2相同的数据进行训练和微调，但权重不同（详情请参阅研究论文的第2节和表1）。

评估结果

有关主要模型的评估和详细消融研究，请参阅研究论文的第3节，有关安全评估请参阅第4节。

伦理考虑和局限性

Code Llama及其变体是一项新技术，使用时存在风险。到目前为止进行的测试均使用英语，且未涵盖也无法涵盖所有场景。因此，与所有大语言模型一样，Code Llama的潜在输出无法提前预测，并且在某些情况下，模型可能会对用户提示产生不准确或令人反感的响应。因此，在部署Code Llama的任何应用程序之前，开发人员应针对其特定应用对模型进行安全测试和调整。

请参阅负责任使用指南。

模型列表

	基础模型	Python	指令模型
7B	codellama/CodeLlama-7b-hf	codellama/CodeLlama-7b-Python-hf	codellama/CodeLlama-7b-Instruct-hf
13B	codellama/CodeLlama-13b-hf	codellama/CodeLlama-13b-Python-hf	codellama/CodeLlama-13b-Instruct-hf
34B	codellama/CodeLlama-34b-hf	codellama/CodeLlama-34b-Python-hf	codellama/CodeLlama-34b-Instruct-hf
70B	codellama/CodeLlama-70b-hf	codellama/CodeLlama-70b-Python-hf	codellama/CodeLlama-70b-Instruct-hf