模型简介
模型特点
模型能力
使用案例
🚀 Code Llama
Code Llama是一系列预训练和微调的生成式文本模型,参数规模从70亿到700亿不等。本仓库是基于Hugging Face Transformers格式的70B基础版本模型。该模型专为通用代码合成和理解而设计。其他模型的链接可在底部索引中找到。
🚀 快速开始
要使用此模型,请确保安装transformers
:
pip install transformers accelerate
✨ 主要特性
- 模型能力:
- [x] 代码补全。
- [ ] 代码填充。
- [ ] 指令响应/聊天。
- [ ] Python专业处理。
📦 安装指南
要使用此模型,需安装transformers
库:
pip install transformers accelerate
📚 详细文档
模型详情
- 注意:此模型的使用受Meta许可证的约束。Meta开发并公开发布了Code Llama系列大语言模型(LLM)。
- 模型开发者:Meta
- 模型变体:Code Llama有四种模型规模和三种变体:
- Code Llama:用于通用代码合成和理解的基础模型
- Code Llama - Python:专门为Python设计
- Code Llama - Instruct:用于指令跟随和更安全的部署 所有变体都有7B、13B、34B和70B参数规模。
- 本仓库内容:本仓库包含70B参数模型的基础版本。
- 输入:模型仅接受文本输入。
- 输出:模型仅生成文本输出。
- 模型架构:Code Llama是一个自回归语言模型,采用优化的Transformer架构。它在训练时最多支持16k个标记,推理时最多支持100k个标记。
- 模型训练时间:Code Llama及其变体在2023年1月至2024年1月期间进行训练。
- 模型状态:这是一个基于离线数据集训练的静态模型。随着我们根据社区反馈改进模型安全性,未来将发布Code Llama - Instruct的新版本。
- 许可证:可在https://ai.meta.com/resources/models-and-libraries/llama-downloads/获取自定义商业许可证。
- 研究论文:更多信息可在论文“Code Llama: Open Foundation Models for Code”或其arXiv页面中找到。
预期用途
- 预期用例:Code Llama及其变体旨在用于英语和相关编程语言的商业和研究用途。基础模型Code Llama可适用于各种代码合成和理解任务,Code Llama - Python专门用于处理Python编程语言,Code Llama - Instruct则更安全地用于代码助手和生成应用。
- 非预期用途:以任何违反适用法律法规(包括贸易合规法律)的方式使用;使用英语以外的语言;以Code Llama及其变体的可接受使用政策和许可协议禁止的任何其他方式使用。
硬件和软件
- 训练因素:我们使用了自定义训练库。已发布模型的训练和微调是在Meta的研究超级集群上进行的。
- 碳足迹:总体而言,训练所有12个Code Llama模型需要在A100 - 80GB(热设计功耗350 - 400W)类型的硬件上进行1400K GPU小时的计算。估计总排放量为228.55 tCO2eq,其中100%由Meta的可持续发展计划抵消。
评估结果
请参阅研究论文第3节中主要模型的评估和详细消融实验,以及第4节中的安全评估。
伦理考量和局限性
Code Llama及其变体是一项新技术,使用时存在风险。到目前为止的测试都是用英语进行的,且无法涵盖所有场景。因此,与所有大语言模型一样,Code Llama的潜在输出无法提前预测,在某些情况下,模型可能会对用户提示产生不准确或令人反感的响应。因此,在部署Code Llama的任何应用之前,开发者应针对其特定应用对模型进行安全测试和调整。
请参阅https://ai.meta.com/llama/responsible-use-guide上的负责任使用指南。
模型使用索引
规模 | 基础模型 | Python | 指令模型 |
---|---|---|---|
7B | [meta - llama/CodeLlama - 7b - hf](https://huggingface.co/meta - llama/CodeLlama - 7b - hf) | [meta - llama/CodeLlama - 7b - Python - hf](https://huggingface.co/meta - llama/CodeLlama - 7b - Python - hf) | [meta - llama/CodeLlama - 7b - Instruct - hf](https://huggingface.co/meta - llama/CodeLlama - 7b - Instruct - hf) |
13B | [meta - llama/CodeLlama - 13b - hf](https://huggingface.co/meta - llama/CodeLlama - 13b - hf) | [meta - llama/CodeLlama - 13b - Python - hf](https://huggingface.co/meta - llama/CodeLlama - 13b - Python - hf) | [meta - llama/CodeLlama - 13b - Instruct - hf](https://huggingface.co/meta - llama/CodeLlama - 13b - Instruct - hf) |
34B | [meta - llama/CodeLlama - 34b - hf](https://huggingface.co/meta - llama/CodeLlama - 34b - hf) | [meta - llama/CodeLlama - 34b - Python - hf](https://huggingface.co/meta - llama/CodeLlama - 34b - Python - hf) | [meta - llama/CodeLlama - 34b - Instruct - hf](https://huggingface.co/meta - llama/CodeLlama - 34b - Instruct - hf) |
70B | [meta - llama/CodeLlama - 70b - hf](https://huggingface.co/meta - llama/CodeLlama - 70b - hf) | [meta - llama/CodeLlama - 70b - Python - hf](https://huggingface.co/meta - llama/CodeLlama - 70b - Python - hf) | [meta - llama/CodeLlama - 70b - Instruct - hf](https://huggingface.co/meta - llama/CodeLlama - 70b - Instruct - hf) |
模型使用许可协议
额外的访问限制说明
您需要与Meta共享联系信息才能访问此模型。
Llama 2社区许可协议
“协议”指本协议中规定的使用、复制、分发和修改Llama材料的条款和条件。 “文档”指Meta在https://ai.meta.com/resources/models-and-libraries/llama-downloads/上分发的Llama 2随附的规格、手册和文档。 “被许可方”或“您”指您本人,或您的雇主,或任何其他个人或实体(如果您代表该个人或实体签订本协议),且该个人或实体达到适用法律、规则或法规要求的提供法律同意的年龄,并且如果您代表其签订本协议,具有约束您的雇主或该其他个人或实体的合法权力。 “Llama 2”指基础大语言模型以及软件和算法,包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及Meta在ai.meta.com/resources/models-and-libraries/llama-downloads/上分发的上述内容的其他元素。 “Llama材料”指根据本协议提供的Meta专有的Llama 2和文档(及其任何部分)的统称。 “Meta”或“我们”指Meta Platforms Ireland Limited(如果您位于欧洲经济区(EEA)或瑞士,或者如果您是一个实体,您的主要营业地位于欧洲经济区或瑞士)和Meta Platforms, Inc.(如果您位于欧洲经济区或瑞士以外)。
通过点击下面的“我接受”,或使用或分发Llama材料的任何部分或元素,您同意受本协议约束。
- 许可权利和再分发
- 权利授予:您被授予在Meta体现在Llama材料中的知识产权或其他权利下的非排他性、全球性、不可转让且免版税的有限许可,以使用、复制、分发、拷贝、创建衍生作品并对Llama材料进行修改。
- 再分发和使用
- 如果您将Llama材料或其任何衍生作品分发给第三方,您应向该第三方提供本协议的副本。
- 如果您作为集成最终用户产品的一部分从被许可方处接收Llama材料或其任何衍生作品,则本协议第2条不适用于您。
- 您在分发的所有Llama材料副本中,必须在作为此类副本一部分分发的“通知”文本文件中保留以下归属声明:“Llama 2根据LLAMA 2社区许可证获得许可,版权所有 (c) Meta Platforms, Inc. 保留所有权利。”
- 您对Llama材料的使用必须遵守适用的法律法规(包括贸易合规法律法规),并遵守Llama材料的可接受使用政策(可在https://ai.meta.com/llama/use-policy获取),该政策特此通过引用并入本协议。
- 您不得使用Llama材料或Llama材料的任何输出或结果来改进任何其他大语言模型(不包括Llama 2或其衍生作品)。
- 额外的商业条款:如果在Llama 2版本发布日期,被许可方或被许可方关联公司提供的产品或服务的月活跃用户在前一个日历月超过7亿,则您必须向Meta请求许可,Meta可自行决定是否授予您许可,并且除非Meta另行明确授予您此类权利,否则您无权行使本协议下的任何权利。
- 保修免责声明:除非适用法律要求,否则Llama材料及其任何输出和结果均按“现状”提供,不提供任何形式的保证,无论是明示的还是暗示的,包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您独自负责确定使用或再分发Llama材料的适当性,并承担与您使用Llama材料及其任何输出和结果相关的任何风险。
- 责任限制:在任何情况下,Meta或其关联公司均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害承担责任,无论责任理论如何,无论是在合同、侵权、疏忽、产品责任或其他方面,即使Meta或其关联公司已被告知此类损害的可能性。
- 知识产权
- 本协议未授予商标许可,并且在与Llama材料相关的情况下,除非在描述和再分发Llama材料时进行合理和惯常使用所需,否则Meta和被许可方均不得使用对方或其任何关联公司拥有或关联的任何名称或标记。
- 鉴于Meta对Llama材料及其衍生作品的所有权,就您制作的Llama材料的任何衍生作品和修改而言,在您和Meta之间,您是且将是此类衍生作品和修改的所有者。
- 如果您对Meta或任何实体提起诉讼或其他法律程序(包括在诉讼中的交叉索赔或反诉),声称Llama材料或Llama 2的输出或结果,或上述任何内容的任何部分,构成侵犯您拥有或可许可的知识产权或其他权利,则本协议授予您的任何许可应自该诉讼或索赔提起之日起终止。您将赔偿并使Meta免受任何第三方因您使用或分发Llama材料而产生或与之相关的任何索赔。
- 期限和终止:本协议的期限自您接受本协议或访问Llama材料时开始,并将持续有效,直至根据本协议的条款和条件终止。如果您违反本协议的任何条款或条件,Meta可终止本协议。本协议终止后,您应删除并停止使用Llama材料。第3条、第4条和第7条在本协议终止后仍然有效。
- 适用法律和管辖权:本协议将受加利福尼亚州法律管辖并依其解释,不考虑法律选择原则,并且《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。
使用政策
Llama 2可接受使用政策
Meta致力于促进其工具和功能(包括Llama 2)的安全和公平使用。如果您访问或使用Llama 2,您同意遵守本可接受使用政策(“政策”)。本政策的最新版本可在ai.meta.com/llama/use-policy找到。
禁止使用情况
我们希望每个人都能安全、负责任地使用Llama 2。您同意您不会使用,也不会允许他人使用Llama 2进行以下行为:
- 违反法律或他人权利
- 参与、促进、生成、促成、鼓励、策划、煽动或进一步推动非法或违法活动或内容,例如:
- 暴力或恐怖主义
- 对儿童的剥削或伤害,包括招揽、创建、获取或传播儿童剥削内容,或未能报告儿童性虐待材料
- 人口贩运、剥削和性暴力
- 向未成年人非法分发信息或材料,包括淫秽材料,或未能对此类信息或材料采用法律要求的年龄限制
- 性招揽
- 任何其他犯罪活动
- 参与、促进、煽动或便利对个人或群体的骚扰、虐待、威胁或欺凌
- 参与、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为
- 从事未经授权或无执照的任何专业实践,包括但不限于金融、法律、医疗/健康或相关专业实践
- 在未获得适用法律要求的权利和同意的情况下,收集、处理、披露、生成或推断个人的健康、人口统计或其他敏感个人或私人信息
- 参与或便利任何侵犯、盗用或以其他方式侵犯任何第三方权利的行为或生成任何内容,包括使用Llama 2材料的任何产品或服务的输出或结果
- 创建、生成或便利创建恶意代码、恶意软件、计算机病毒,或进行任何可能禁用、使负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的其他行为
- 参与、促进、生成、促成、鼓励、策划、煽动或进一步推动非法或违法活动或内容,例如:
- 参与、促进、煽动、便利或协助策划或开展对个人造成死亡或身体伤害风险的活动,包括与以下相关的Llama 2使用:
- 军事、战争、核工业或应用、间谍活动,用于受美国国务院维护的《国际武器贸易条例》(ITAR)管制的材料或活动
- 枪支和非法武器(包括武器开发)
- 非法毒品和受管制/受控物质
- 关键基础设施、运输技术或重型机械的操作
- 自我伤害或对他人的伤害,包括自杀、自残和饮食失调
- 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容
- 故意欺骗或误导他人,包括与以下相关的Llama 2使用:
- 生成、促进或进一步推动欺诈或创建或推广虚假信息
- 生成、促进或进一步推动诽谤性内容,包括创建诽谤性声明、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 表示Llama 2的使用或输出是人类生成的
- 生成或便利虚假的在线互动,包括虚假评论和其他虚假在线互动方式
- 未能向最终用户适当披露您的AI系统的任何已知危险
请通过以下方式之一报告任何违反本政策、软件“漏洞”或其他可能导致违反本政策的问题:
- 报告模型问题:github.com/facebookresearch/llama
- 报告模型生成的风险内容:developers.facebook.com/llama_output_feedback
- 报告漏洞和安全问题:facebook.com/whitehat/info
- 报告违反可接受使用政策或未经授权使用Llama的情况:LlamaUseReport@meta.com
额外的访问信息收集
属性 | 详情 |
---|---|
名字 | 文本输入 |
姓氏 | 文本输入 |
出生日期 | 日期选择器 |
国家 | 国家选择 |
所属机构 | 文本输入 |
地理位置 | IP定位 |
通过点击下面的“提交”,我接受许可协议的条款,并确认我提供的信息将根据Meta隐私政策进行收集、存储、处理和共享。
⚠️ 重要提示
您需要与Meta共享联系信息才能访问此模型。
💡 使用建议
在使用Code Llama模型前,请仔细阅读相关的许可协议和使用政策,确保您的使用符合规定。同时,对模型进行充分的安全测试和调整,以适应您的具体应用场景。



