CodeLlama-13b-hf开源代码生成模型 - 免费部署助力通用代码生成与理解

首页

Codellama 13b Hf

由 meta-llama 开发

Code Llama是由Meta开发的70亿至340亿参数规模的预训练及微调生成文本模型系列，适用于通用代码生成与理解

大型语言模型

Transformers

其他#代码生成 #多语言编程 #大参数规模

下载量 482

发布时间 : 3/13/2024

模型简介

130亿参数的基础版本，适用于通用代码生成与理解任务

模型特点

多参数规模选择

提供7B/13B/34B三种参数规模，满足不同计算需求

专用版本优化

提供基础版/Python专用版/指令版三种变体，针对不同场景优化

代码填充能力

支持在代码中间位置进行智能填充（Infilling）

模型能力

代码补全

代码填充

代码理解

Python代码生成

使用案例

软件开发

代码自动补全

在IDE中提供智能代码补全建议

提升开发者工作效率

代码审查辅助

分析代码逻辑并提供改进建议

提高代码质量

教育

编程教学辅助

生成教学示例代码或解释编程概念

增强学习体验

🚀 Code Llama

Code Llama是一系列预训练和微调的生成式文本模型，参数规模从70亿到700亿不等。本仓库是基于Hugging Face Transformers格式的130亿参数基础版本模型。该模型专为通用代码合成和理解而设计。其他模型的链接可在底部索引中找到。

🚀 快速开始

安装依赖

要使用此模型，请确保安装transformers库：

pip install transformers accelerate

代码示例

from transformers import AutoTokenizer
import transformers
import torch

model = "meta-llama/CodeLlama-13b-hf"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

sequences = pipeline(
    'import socket\n\ndef ping_exponential_backoff(host: str):',
    do_sample=True,
    top_k=10,
    temperature=0.1,
    top_p=0.95,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id,
    max_length=200,
)
for seq in sequences:
    print(f"Result: {seq['generated_text']}")

✨ 主要特性

代码补全：支持代码的自动补全功能。
代码填充：能够完成代码中间部分的填充。
指令/聊天：暂不支持。
Python专业支持：暂不支持。

📦 安装指南

使用此模型前，需要安装transformers和accelerate库，可通过以下命令进行安装：

pip install transformers accelerate

💻 使用示例

基础用法

from transformers import AutoTokenizer
import transformers
import torch

model = "meta-llama/CodeLlama-13b-hf"

tokenizer = AutoTokenizer.from_pretrained(model)
pipeline = transformers.pipeline(
    "text-generation",
    model=model,
    torch_dtype=torch.float16,
    device_map="auto",
)

sequences = pipeline(
    'import socket\n\ndef ping_exponential_backoff(host: str):',
    do_sample=True,
    top_k=10,
    temperature=0.1,
    top_p=0.95,
    num_return_sequences=1,
    eos_token_id=tokenizer.eos_token_id,
    max_length=200,
)
for seq in sequences:
    print(f"Result: {seq['generated_text']}")

📚 详细文档

模型详情

注意：使用此模型需遵循Meta的许可协议。Meta开发并公开发布了Code Llama系列大语言模型（LLM）。
模型开发者：Meta
模型变体：Code Llama有三种模型规模和三种变体：
- Code Llama：基础模型，用于通用代码合成和理解。
- Code Llama - Python：专门为Python设计。
- Code Llama - Instruct：用于指令跟随和更安全的部署。所有变体都有70亿、130亿、340亿和700亿参数的版本。
本仓库内容：包含130亿参数的基础版本模型。
输入：模型仅接受文本输入。
输出：模型仅生成文本输出。
模型架构：Code Llama是一个自回归语言模型，采用了优化的Transformer架构。
模型训练时间：Code Llama及其变体于2023年1月至2023年7月期间进行训练。
模型状态：这是一个基于离线数据集训练的静态模型。未来，随着我们根据社区反馈改进模型安全性，Code Llama - Instruct的新版本将会发布。
许可证：可在https://ai.meta.com/resources/models-and-libraries/llama-downloads/获取自定义商业许可证。
研究论文：更多信息可在论文“Code Llama: Open Foundation Models for Code”或其arXiv页面中找到。

预期用途

预期用例：Code Llama及其变体旨在用于英语和相关编程语言的商业和研究用途。基础模型Code Llama可用于各种代码合成和理解任务，Code Llama - Python专门用于处理Python编程语言，Code Llama - Instruct用于指令跟随和更安全的代码助手及生成应用程序部署。
非预期用途：禁止以任何违反适用法律法规（包括贸易合规法律）的方式使用。禁止使用英语以外的语言。禁止以违反Code Llama及其变体的可接受使用政策和许可协议的任何其他方式使用。

硬件和软件

训练因素：使用自定义训练库。已发布模型的训练和微调在Meta的研究超级集群上进行。
碳足迹：总体而言，训练所有9个Code Llama模型需要在A100 - 80GB（TDP为350 - 400W）硬件上进行400,000 GPU小时的计算。估计总排放量为65.3 tCO2eq，其中100%已通过Meta的可持续发展计划进行抵消。

训练数据

此处报告的所有实验和已发布模型均使用与Llama 2相同的数据进行训练和微调，但权重不同（详情请见研究论文的第2节和表1）。

评估结果

研究论文的第3节提供了主要模型的评估和详细分析，第4节提供了安全评估。

伦理考量和局限性

Code Llama及其变体是一项具有使用风险的新技术。到目前为止，测试仅在英语环境中进行，且无法涵盖所有场景。因此，与所有大语言模型一样，Code Llama的潜在输出无法提前预测，在某些情况下，模型可能会对用户提示产生不准确或令人反感的响应。因此，在部署Code Llama的任何应用程序之前，开发者应针对其特定应用对模型进行安全测试和调整。

请参阅负责任使用指南。

模型使用许可协议

⚠️ 重要提示

您需要与Meta共享联系信息才能访问此模型。

LLAMA 2社区许可协议

“协议”指本协议中规定的使用、复制、分发和修改Llama材料的条款和条件。 “文档”指Meta在https://ai.meta.com/resources/models-and-libraries/llama-downloads/上分发的Llama 2随附的规格、手册和文档。 “被许可方”或“您”指您本人，或您的雇主，或任何其他个人或实体（如果您代表该个人或实体签订本协议），且该个人或实体已达到适用法律、规则或法规要求的提供法律同意的年龄，并且如果您代表其签订本协议，该个人或实体具有约束您的雇主或该其他个人或实体的合法权力。 “Llama 2”指Meta在ai.meta.com/resources/models-and-libraries/llama-downloads/上分发的基础大语言模型、软件和算法，包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及上述内容的其他元素。 “Llama材料”指根据本协议提供的Meta专有的Llama 2和文档（及其任何部分）的统称。 “Meta”或“我们”指Meta Platforms Ireland Limited（如果您位于欧洲经济区（EEA）或瑞士，或者如果您是一个实体，您的主要营业地位于欧洲经济区或瑞士）和Meta Platforms, Inc.（如果您位于欧洲经济区或瑞士以外）。通过点击下面的“我接受”，或使用或分发Llama材料的任何部分或元素，您同意受本协议的约束。

许可权利和再分发
- 权利授予：您被授予在Llama材料中体现的Meta知识产权或Meta拥有的其他权利下的非排他性、全球性、不可转让和免版税的有限许可，以使用、复制、分发、拷贝、创建衍生作品并对Llama材料进行修改。
- 再分发和使用：
  - 如果您将Llama材料或其任何衍生作品分发给第三方，您应向该第三方提供本协议的副本。
  - 如果您作为集成最终用户产品的一部分从被许可方处接收Llama材料或其任何衍生作品，则本协议第2条不适用于您。
  - 您必须在分发的所有Llama材料副本中，在作为此类副本一部分分发的“通知”文本文件中保留以下归属声明：“Llama 2根据LLAMA 2社区许可协议获得许可，版权所有 (c) Meta Platforms, Inc. 保留所有权利。”
  - 您使用Llama材料必须遵守适用的法律法规（包括贸易合规法律法规），并遵守Llama材料的可接受使用政策（可在https://ai.meta.com/llama/use-policy获取），该政策特此通过引用并入本协议。
  - 您不得使用Llama材料或Llama材料的任何输出或结果来改进任何其他大语言模型（不包括Llama 2或其衍生作品）。
额外商业条款：如果在Llama 2版本发布日期，被许可方或其关联公司提供的产品或服务的月活跃用户在前一个日历月超过7亿，您必须向Meta请求许可，Meta可自行决定是否授予您许可，并且在Meta明确授予您此类权利之前，您无权行使本协议下的任何权利。
保修免责声明：除非适用法律要求，否则Llama材料及其任何输出和结果均按“现状”提供，不提供任何形式的明示或暗示保证，包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您独自负责确定使用或再分发Llama材料的适当性，并承担使用Llama材料及其任何输出和结果相关的任何风险。
责任限制：在任何情况下，Meta或其关联公司均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害承担责任，无论责任理论是合同、侵权、疏忽、产品责任还是其他，即使Meta或其关联公司已被告知此类损害的可能性。
知识产权
- 本协议未授予任何商标许可，并且在与Llama材料相关的情况下，除非在描述和再分发Llama材料时进行合理和惯常使用所需，否则Meta和被许可方均不得使用对方或其任何关联公司拥有或关联的任何名称或标记。
- 鉴于Meta对Llama材料及其为Meta制作的衍生作品的所有权，就您制作的Llama材料的任何衍生作品和修改而言，在您和Meta之间，您是且将是此类衍生作品和修改的所有者。
- 如果您对Meta或任何实体提起诉讼或其他法律程序（包括在诉讼中的交叉索赔或反诉），声称Llama材料或Llama 2的输出或结果，或上述任何内容的任何部分，构成侵犯您拥有或可许可的知识产权或其他权利，则本协议授予您的任何许可应自此类诉讼或索赔提起之日起终止。您将赔偿并使Meta免受任何第三方因您使用或分发Llama材料而产生的或与之相关的任何索赔。
期限和终止：本协议的期限自您接受本协议或访问Llama材料时开始，并将持续有效，直至根据本协议的条款和条件终止。如果您违反本协议的任何条款或条件，Meta可终止本协议。本协议终止后，您应删除并停止使用Llama材料。第3条、第4条和第7条在本协议终止后仍然有效。
适用法律和管辖权：本协议将受加利福尼亚州法律管辖和解释，不考虑法律选择原则，并且《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。

Llama 2可接受使用政策

Meta致力于促进其工具和功能（包括Llama 2）的安全和公平使用。如果您访问或使用Llama 2，您同意本可接受使用政策（“政策”）。本政策的最新版本可在ai.meta.com/llama/use-policy找到。

禁止用途

我们希望每个人都能安全、负责地使用Llama 2。您同意您不会使用或允许他人使用Llama 2进行以下操作：

违反法律或他人权利
- 参与、促进、生成、促成、鼓励、策划、煽动或进一步推动非法或违法活动或内容，例如：
  - 暴力或恐怖主义
  - 对儿童的剥削或伤害，包括招揽、创建、获取或传播儿童剥削内容或未能报告儿童性虐待材料
  - 人口贩运、剥削和性暴力
  - 向未成年人非法分发信息或材料，包括淫秽材料，或未能对此类信息或材料采用法律要求的年龄限制
  - 性招揽
  - 任何其他犯罪活动
- 参与、促进、煽动或便利对个人或群体的骚扰、虐待、威胁或欺凌
- 参与、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为
- 从事未经授权或无执照的任何专业实践，包括但不限于金融、法律、医疗/健康或相关专业实践
- 在未获得适用法律要求的权利和同意的情况下，收集、处理、披露、生成或推断个人的健康、人口统计或其他敏感个人或私人信息
- 从事或便利任何侵犯、盗用或以其他方式侵犯任何第三方权利的行为或生成任何内容，包括使用Llama 2材料的任何产品或服务的输出或结果
- 创建、生成或便利创建恶意代码、恶意软件、计算机病毒或进行任何其他可能禁用、使负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的操作
参与、促进、煽动、便利或协助策划或开展对个人造成死亡或身体伤害风险的活动，包括与以下方面相关的Llama 2使用：
- 军事、战争、核工业或应用、间谍活动、用于受美国国务院维护的《国际武器贸易条例》（ITAR）管制的材料或活动
- 枪支和非法武器（包括武器开发）
- 非法药物和受管制/受控物质
- 关键基础设施、运输技术或重型机械的操作
- 自我伤害或伤害他人，包括自杀、自残和饮食失调
- 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容
故意欺骗或误导他人，包括与以下方面相关的Llama 2使用：
- 生成、促进或进一步推动欺诈或创建或促进虚假信息
- 生成、促进或进一步推动诽谤性内容，包括创建诽谤性声明、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 声称Llama 2的使用或输出是人类生成的
- 生成或便利虚假的在线互动，包括虚假评论和其他虚假在线互动方式
未能向最终用户适当披露您的AI系统的任何已知危险