模型简介
模型特点
模型能力
使用案例
🚀 Llama 3.2大语言模型
Llama 3.2是Meta推出的多语言大语言模型集合,有1B和3B两种规模。它针对多语言对话场景进行了优化,在常见行业基准测试中表现出色,可广泛应用于商业和研究领域。
🚀 快速开始
使用Llama 3.2前,请确保你已同意Llama 3.2社区许可协议。若要提供对模型的反馈或评论,可查看Llama Models的README。如需了解更多关于生成参数的技术信息以及如何在应用程序中使用Llama 3.2的方法,请访问此处。
✨ 主要特性
- 多语言支持:官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语,且在更多语言数据上进行了训练。
- 高性能表现:在常见行业基准测试中,超越了许多现有的开源和闭源聊天模型。
- 多种应用场景:适用于商业和研究,可用于知识检索、总结、移动AI写作助手等。
- 优化架构:采用优化的Transformer架构,微调版本使用监督微调(SFT)和基于人类反馈的强化学习(RLHF)。
📦 安装指南
文档未提供具体安装步骤,故跳过此章节。
💻 使用示例
文档未提供具体代码示例,故跳过此章节。
📚 详细文档
模型信息
属性 | 详情 |
---|---|
模型开发者 | Meta |
模型架构 | Llama 3.2是自回归语言模型,采用优化的Transformer架构。微调版本使用监督微调(SFT)和基于人类反馈的强化学习(RLHF)以符合人类对有用性和安全性的偏好。 |
支持语言 | 官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。开发者可在遵守许可协议和使用政策的前提下,对其他语言进行微调。 |
模型发布日期 | 2024年10月24日 |
状态 | 这是一个基于离线数据集训练的静态模型,未来可能会发布改进版本。 |
许可证 | 使用Llama 3.2受Llama 3.2社区许可协议(自定义商业许可协议)约束。 |
模型参数详情
模型 | 训练数据 | 参数 | 输入模态 | 输出模态 | 上下文长度 | GQA | 共享嵌入 | 令牌计数 | 知识截止日期 |
---|---|---|---|---|---|---|---|---|---|
Llama 3.2(仅文本) | 公开可用在线数据的新组合 | 1B (1.23B) | 多语言文本 | 多语言文本和代码 | 128k | 是 | 是 | 最多9T令牌 | 2023年12月 |
3B (3.21B) | 多语言文本 | 多语言文本和代码 | |||||||
Llama 3.2量化版(仅文本) | 公开可用在线数据的新组合 | 1B (1.23B) | 多语言文本 | 多语言文本和代码 | 8k | 是 | 是 | 最多9T令牌 | 2023年12月 |
3B (3.21B) | 多语言文本 | 多语言文本和代码 |
预期用途
预期用例
- 商业和研究:适用于多种语言的商业和研究用途。
- 指令微调文本模型:用于类似助手的聊天和代理应用,如知识检索、总结、移动AI写作助手以及查询和提示重写。
- 预训练模型:可适应各种自然语言生成任务。
- 量化模型:适用于计算资源有限的设备上的各种用例。
超出范围的使用
- 违反适用法律法规(包括贸易合规法律)的任何使用方式。
- 违反可接受使用政策和Llama 3.2社区许可协议的任何其他使用方式。
- 使用本模型卡中未明确支持的语言。
硬件和软件
训练因素
使用自定义训练库、Meta定制的GPU集群和生产基础设施进行预训练。微调、量化、注释和评估也在生产基础设施上进行。
训练能源使用
训练在H100 - 80GB(TDP为700W)类型的硬件上累计使用了916k GPU小时的计算资源。训练时间是训练每个模型所需的总GPU时间,功耗是每个GPU设备的峰值功率容量,并根据电源使用效率进行了调整。
训练温室气体排放
训练估计的基于位置的总温室气体排放量为240吨CO2eq。自2020年以来,Meta在全球运营中保持净零温室气体排放,并以可再生能源匹配其100%的电力使用;因此,训练的基于市场的总温室气体排放量为0吨CO2eq。
模型 | 训练时间(GPU小时) | 对数生成时间(GPU小时) | 训练功耗(W) | 训练基于位置的温室气体排放(吨CO2eq) | 训练基于市场的温室气体排放(吨CO2eq) |
---|---|---|---|---|---|
Llama 3.2 1B | 370k | - | 700 | 107 | 0 |
Llama 3.2 3B | 460k | - | 700 | 133 | 0 |
Llama 3.2 1B SpinQuant | 1.7 | 0 | 700 | 可忽略不计* | 0 |
Llama 3.2 3B SpinQuant | 2.4 | 0 | 700 | 可忽略不计* | 0 |
Llama 3.2 1B QLora | 1.3k | 0 | 700 | 0.381 | 0 |
Llama 3.2 3B QLora | 1.6k | 0 | 700 | 0.461 | 0 |
总计 | 833k | 86k | 240 | 0 |
注:Llama 3.2 1B SpinQuant和Llama 3.2 3B SpinQuant的基于位置的CO2e排放量均小于0.001公吨,这是由于所需的训练GPU小时数极少。
确定训练能源使用和温室气体排放的方法可在此处找到。由于Meta正在公开发布这些模型,其他人不会产生训练能源使用和温室气体排放。
训练数据
- 概述:Llama 3.2在来自公开可用来源的多达9万亿令牌的数据上进行了预训练。对于1B和3B的Llama 3.2模型,在模型开发的预训练阶段,将Llama 3.1 8B和70B模型的对数(logits)纳入其中,这些较大模型的输出(logits)被用作令牌级目标。剪枝后使用知识蒸馏来恢复性能。在训练后,采用了与Llama 3.1类似的方法,通过在预训练模型上进行几轮对齐来生成最终的聊天模型。每一轮都涉及监督微调(SFT)、拒绝采样(RS)和直接偏好优化(DPO)。
- 数据新鲜度:预训练数据的截止日期为2023年12月。
量化
量化方案
当前的量化方案是结合PyTorch的ExecuTorch推理框架和Arm CPU后端设计的,考虑了模型质量、预填充/解码速度和内存占用等指标。量化方案包括三个部分:
- 所有Transformer块中的所有线性层的权重被量化为4位分组方案(组大小为32),激活值采用8位每个令牌的动态量化。
- 分类层的权重被量化为8位每通道,激活值采用8位每个令牌的动态量化。
- 与分类层类似,嵌入层采用8位每通道的量化。
量化感知训练和LoRA
使用低秩自适应(LoRA)的量化感知训练(QAT)模型仅经过训练后阶段,使用与全精度模型相同的数据。为了初始化QAT,利用监督微调(SFT)后获得的BF16 Llama 3.2模型检查点,并使用QAT进行额外的一轮完整的SFT训练。然后冻结QAT模型的主干,并对Transformer块内的所有层应用LoRA适配器进行另一轮SFT。同时,LoRA适配器的权重和激活值保持在BF16。由于该方法类似于Dettmers等人(2023)的QLoRA(即量化后使用LoRA适配器),因此将此方法称为QLoRA。最后,使用直接偏好优化(DPO)对得到的模型(包括主干和LoRA适配器)进行微调。
SpinQuant
SpinQuant与生成式训练后量化(GPTQ)一起应用。对于SpinQuant旋转矩阵的微调,使用WikiText 2数据集中序列长度为2048的800个样本进行了100次迭代的优化。对于GPTQ,使用了相同数据集中相同序列长度的128个样本。
基准测试 - 英文文本
基础预训练模型
类别 | 基准测试 | 样本数 | 指标 | Llama 3.2 1B | Llama 3.2 3B | Llama 3.1 8B |
---|---|---|---|---|---|---|
通用 | MMLU | 5 | macro_avg/acc_char | 32.2 | 58 | 66.7 |
AGIEval English | 3 - 5 | average/acc_char | 23.3 | 39.2 | 47.8 | |
ARC - Challenge | 25 | acc_char | 32.8 | 69.1 | 79.7 | |
阅读理解 | SQuAD | 1 | em | 49.2 | 67.7 | 77 |
QuAC (F1) | 1 | f1 | 37.9 | 42.9 | 44.9 | |
DROP (F1) | 3 | f1 | 28.0 | 45.2 | 59.5 | |
长上下文 | Needle in Haystack | 0 | em | 96.8 | 1 | 1 |
指令微调模型
| 能力 | 基准测试 | 样本数 | 指标 | Llama 3.2 1B bf16 | Llama 3.2 1B Vanilla PTQ** | Llama 3.2 1B Spin Quant | Llama 3.2 1B QLoRA | Llama 3.2 3B bf16 | Llama 3.2 3B Vanilla PTQ** | Llama 3.2 3B Spin Quant | Llama 3.2 3B QLoRA | Llama 3.1 8B | | :---: | ----- | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | :---: | | 通用 | MMLU | 5 | macro_avg/acc | 49.3 | 43.3 | 47.3 | 49.0 | 63.4 | 60.5 | 62 | 62.4 | 69.4 | | 重写 | Open - rewrite eval | 0 | micro_avg/rougeL | 41.6 | 39.2 | 40.9 | 41.2 | 40.1 | 40.3 | 40.8 | 40.7 | 40.9 | | 总结 | TLDR9+ (test) | 1 | rougeL | 16.8 | 14.9 | 16.7 | 16.8 | 19.0 | 19.1 | 19.2 | 19.1 | 17.2 | | 指令遵循 | IFEval | 0 | Avg(Prompt/Instruction acc Loose/Strict) | 59.5 | 51.5 | 58.4 | 55.6 | 77.4 | 73.9 | 73.5 | 75.9 | 80.4 | | 数学 | GSM8K (CoT) | 8 | em_maj1@1 | 44.4 | 33.1 | 40.6 | 46.5 | 77.7 | 72.9 | 75.7 | 77.9 | 84.5 | | | MATH (CoT) | 0 | final_em | 30.6 | 20.5 | 25.3 | 31.0 | 48.0 | 44.2 | 45.3 | 49.2 | 51.9 | | 推理 | ARC - C | 0 | acc | 59.4 | 54.3 | 57 | 60.7 | 78.6 | 75.6 | 77.6 | 77.6 | 83.4 | | | GPQA | 0 | acc | 27.2 | 25.9 | 26.3 | 25.9 | 32.8 | 32.8 | 31.7 | 33.9 | 32.8 | | | Hellaswag | 0 | acc | 41.2 | 38.1 | 41.3 | 41.5 | 69.8 | 66.3 | 68 | 66.3 | 78.7 | | 工具使用 | BFCL V2 | 0 | acc | 25.7 | 14.3 | 15.9 | 23.7 | 67.0 | 53.4 | 60.1 | 63.5 | 67.1 | | | Nexus | 0 | macro_avg/acc | 13.5 | 5.2 | 9.6 | 12.5 | 34.3 | 32.4 | 31.5 | 30.1 | 38.5 | | 长上下文 | InfiniteBench/En.QA | 0 | longbook_qa/f1 | 20.3 | N/A | N/A | N/A | 19.8 | N/A | N/A | N/A | 27.3 | | | InfiniteBench/En.MC | 0 | longbook_choice/acc | 38.0 | N/A | N/A | N/A | 63.3 | N/A | N/A | N/A | 72.2 | | | NIH/Multi - needle | 0 | recall | 75.0 | N/A | N/A | N/A | 84.7 | N/A | N/A | N/A | 98.8 | | 多语言 | MGSM (CoT) | 0 | em | 24.5 | 13.7 | 18.2 | 24.4 | 58.2 | 48.9 | 54.3 | 56.8 | 68.9 |
注:仅用于比较目的,该模型未发布。
多语言基准测试
类别 | 基准测试 | 语言 | Llama 3.2 1B | Llama 3.2 1B Vanilla PTQ** | Llama 3.2 1B Spin Quant | Llama 3.2 1B QLoRA | Llama 3.2 3B | Llama 3.2 3B Vanilla PTQ** | Llama 3.2 3B Spin Quant | Llama 3.2 3B QLoRA | Llama 3.1 8B |
---|---|---|---|---|---|---|---|---|---|---|---|
通用 | MMLU (5 - shot, macro_avg/acc) | 葡萄牙语 | 39.8 | 34.9 | 38.9 | 40.2 | 54.5 | 50.9 | 53.3 | 53.4 | 62.1 |
西班牙语 | 41.5 | 36.0 | 39.8 | 41.8 | 55.1 | 51.9 | 53.6 | 53.6 | 62.5 | ||
意大利语 | 39.8 | 34.9 | 38.1 | 40.6 | 53.8 | 49.9 | 52.1 | 51.7 | 61.6 | ||
德语 | 39.2 | 34.9 | 37.5 | 39.6 | 53.3 | 50.0 | 52.2 | 51.3 | 60.6 | ||
法语 | 40.5 | 34.8 | 39.2 | 40.8 | 54.6 | 51.2 | 53.3 | 53.3 | 62.3 | ||
印地语 | 33.5 | 30.0 | 32.1 | 34.0 | 43.3 | 40.4 | 42.0 | 42.1 | 50.9 | ||
泰语 | 34.7 | 31.2 | 32.4 | 34.9 | 44.5 | 41.3 | 44.0 | 42.2 | 50.3 |
注:仅用于比较目的,该模型未发布。
推理时间
在下表中,我们将不同量化方法(SpinQuant和QAT + LoRA)的性能指标与BF16基线进行了比较。评估使用ExecuTorch框架作为推理引擎,以ARM CPU为后端,在Android OnePlus 12设备上进行。
类别 | 解码(令牌/秒) | 首令牌时间(秒) | 预填充(令牌/秒) | 模型大小(PTE文件大小,MB) | 内存大小(RSS,MB) |
---|---|---|---|---|---|
1B BF16(基线) | 19.2 | 1.0 | 60.3 | 2358 | 3,185 |
1B SpinQuant | 50.2 (2.6x) | 0.3 (-76.9%) | 260.5 (4.3x) | 1083 (-54.1%) | 1,921 (-39.7%) |
1B QLoRA | 45.8 (2.4x) | 0.3 (-76.0%) | 252.0 (4.2x) | 1127 (-52.2%) | 2,255 (-29.2%) |
3B BF16(基线) | 7.6 | 3.0 | 21.2 | 6129 | 7,419 |
3B SpinQuant | 19.7 (2.6x) | 0.7 (-76.4%) | 89.7 (4.2x) | 2435 (-60.3%) | 3,726 (-49.8%) |
3B QLoRA | 18.5 (2.4x) | 0.7 (-76.1%) | 88.8 (4.2x) | 2529 (-58.7%) | 4,060 (-45.3%) |
注:
- 性能测量采用基于adb二进制的方法。
- 在Android OnePlus 12设备上进行测量。
- 首令牌时间(TTFT)在提示长度为64时进行测量。
责任与安全
负责任的部署
- 方法:Llama是一种基础技术,旨在用于各种用例。Meta的Llama模型负责任部署的示例可在社区故事网页中找到。Meta的方法是构建最有用的模型,通过使模型安全适应通用用例并解决一系列标准危害,让世界从技术力量中受益。然后,开发者可以根据自己的用例定制安全性,定义自己的政策,并在Llama系统中部署必要的保障措施。Llama 3.2是按照负责任使用指南中概述的最佳实践开发的。
- Llama 3.2指令:
- 目标:进行安全微调的主要目标是为研究社区提供研究安全微调鲁棒性的有价值资源,同时为开发者提供一个现成的、安全且强大的模型,用于各种应用,以减少开发者部署安全AI系统的工作量。实施了与Llama 3相同的安全缓解措施,更多信息可在Llama 3 论文中了解。
- 微调数据:采用多方面的数据收集方法,将供应商提供的人类生成数据与合成数据相结合,以减轻潜在的安全风险。开发了许多基于大语言模型(LLM)的分类器,能够精心选择高质量的提示和响应,加强数据质量控制。
- 拒绝和语气:在Llama 3的基础上,高度重视模型对良性提示的拒绝以及拒绝语气。在安全数据策略中包括了临界和对抗性提示,并修改了安全数据响应以遵循语气指南。
- Llama 3.2系统:
新功能和用例
- 技术进步:Llama的发布通常会引入新功能,除了适用于所有生成式AI用例的最佳实践外,还需要特定的考虑因素。对于Llama 3.2也支持的先前版本的功能,请参阅Llama 3.1模型卡,因为相同的考虑因素也适用于此处。
- 受限环境:Llama 3.2 1B和3B模型预计将部署在高度受限的环境中,如移动设备。使用较小模型的LLM系统与更复杂的大型系统相比,将具有不同的对齐配置文件和安全性/有用性权衡。开发者应确保其系统的安全性满足用例的要求。建议为此类用例使用较轻的系统保障措施,如Llama Guard 3 - 1B或其针对移动设备优化的版本。
评估
- 大规模评估:构建了专门的对抗性评估数据集,并评估了由Llama模型和Purple Llama保障措施组成的系统,以过滤输入提示和输出响应。在上下文中评估应用程序很重要,建议为自己的用例构建专门的评估数据集。
- 红队测试:定期进行红队测试,目标是通过对抗性提示发现风险,并利用这些经验教训改进基准测试和安全调优数据集。早期与关键风险领域的主题专家合作,了解这些现实世界危害的性质以及此类模型如何可能对社会造成意外危害。根据这些对话,为红队制定了一组对抗性目标,例如提取有害信息或重新编程模型以发挥潜在的有害作用。红队由网络安全、对抗性机器学习、负责任AI和内容完整性专家以及在特定地理市场具有内容完整性问题背景的多语言内容专家组成。
关键风险
除了上述安全工作外,还特别关注测量和/或减轻以下关键风险领域:
- CBRNE(化学、生物、放射、核和爆炸武器):Llama 3.2 1B和3B模型是Llama 3.1的较小且能力较弱的衍生模型。对于Llama 3.1 70B和405B,为了评估与化学和生物武器扩散相关的风险,进行了提升测试,旨在评估使用Llama 3.1模型是否会显著提高恶意行为者计划或实施使用此类武器的攻击的能力,并确定此类测试也适用于较小的1B和3B模型。
- 儿童安全:使用专家团队进行了儿童安全风险评估,以评估模型产生可能导致儿童安全风险的输出的能力,并通过微调提供任何必要和适当的风险缓解措施。利用这些专家红队测试会话,在Llama 3模型开发过程中扩大了评估基准的覆盖范围。对于Llama 3,使用基于目标的方法进行了新的深入会话,以评估模型在多个攻击向量上的风险,包括Llama 3训练的其他语言。还与内容专家合作进行红队测试,评估潜在违规内容,同时考虑特定市场的细微差别或经验。
- 网络攻击:对于Llama 3.1 405B,网络攻击提升研究调查了大语言模型是否可以在技能水平和速度方面增强人类在黑客任务中的能力。攻击自动化研究专注于评估大语言模型作为自主代理在网络攻击行动中的能力,特别是在勒索软件攻击的背景下。此评估与之前将大语言模型视为交互式助手的研究不同。主要目标是评估这些模型是否可以在没有人类干预的情况下有效地作为独立代理执行复杂的网络攻击。由于Llama 3.2的1B和3B模型比Llama 3.1 405B更小且能力更弱,因此普遍认为对405B模型进行的测试也适用于Llama 3.2模型。
社区
- 行业合作伙伴关系:生成式AI安全需要专业知识和工具,Meta相信开放社区的力量可以加速其发展。Meta是开放联盟的积极成员,包括AI Alliance、Partnership on AI和MLCommons,积极为安全标准化和透明度做出贡献。鼓励社区采用MLCommons概念验证评估等分类法,以促进安全和内容评估的合作和透明度。Purple Llama工具已开源供社区使用,并广泛分发到包括云服务提供商在内的生态系统合作伙伴。鼓励社区为GitHub仓库做出贡献。
- 资助计划:还设立了Llama影响资助计划,以识别和支持Meta的Llama模型在三个类别(教育、气候和开放创新)中对社会有益的最有吸引力的应用。数百份申请中的20名决赛选手可在此处找到。
- 报告机制:最后,建立了一系列资源,包括输出报告机制和漏洞赏金计划,以在社区的帮助下不断改进Llama技术。
伦理考虑和局限性
- 价值观:Llama 3.2的核心价值观是开放性、包容性和有用性。它旨在为所有人服务,并适用于广泛的用例。因此,它被设计为对具有不同背景、经验和观点的人都可访问。Llama 3.2以用户的实际情况和需求为出发点,不插入不必要的判断或规范性内容,同时认识到即使在某些情况下可能看似有问题的内容,在其他情况下也可能有价值。它尊重所有用户的尊严和自主权,特别是在推动创新和进步的自由思想和表达价值观方面。
- 测试:Llama 3.2是一项新技术,与任何新技术一样,使用它存在风险。到目前为止进行的测试尚未涵盖,也不可能涵盖所有场景。因此,与所有大语言模型一样,Llama 3.2的潜在输出无法提前预测,模型在某些情况下可能会对用户提示产生不准确、有偏见或其他令人反感的响应。因此,在部署Llama 3.2模型的任何应用程序之前,开发者应针对模型的特定应用进行安全测试和调优。请参考可用资源,包括负责任使用指南、信任与安全解决方案和其他资源,以了解更多关于负责任开发的信息。
🔧 技术细节
文档未提供超过50字的具体技术说明,故跳过此章节。
📄 许可证
使用Llama 3.2受Llama 3.2社区许可协议(自定义商业许可协议)约束。协议详情如下:
LLAMA 3.2社区许可协议
Llama 3.2版本发布日期:2024年9月25日
“协议”指本协议中规定的使用、复制、分发和修改Llama材料的条款和条件。
“文档”指Meta在https://llama.meta.com/doc/overview 上分发的随Llama 3.2附带的规格、手册和文档。
“被许可方”或“您”指您本人,或您的雇主,或任何其他个人或实体(如果您代表该个人或实体签订本协议),且该个人或实体达到适用法律、规则或法规要求的提供法律同意的年龄,并且如果您代表他们签订本协议,具有约束您的雇主或该其他个人或实体的法律权力。
“Llama 3.2”指基础大语言模型以及软件和算法,包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及Meta在https://www.llama.com/llama-downloads 上分发的上述内容的其他元素。
“Llama材料”指Meta根据本协议提供的专有Llama 3.2和文档(及其任何部分)的统称。
“Meta”或“我们”指Meta Platforms Ireland Limited(如果您位于欧洲经济区或瑞士,或者如果您是一家实体,您的主要营业地位于欧洲经济区或瑞士)和Meta Platforms, Inc.(如果您位于欧洲经济区或瑞士以外)。
通过点击下面的“我接受”,或使用或分发Llama材料的任何部分或元素,即表示您同意受本协议约束。
- 许可权利和再分发
- a. 权利授予。您被授予在Meta的知识产权或其他权利下的非排他性、全球性、不可转让且免版税的有限许可,以使用、复制、分发、拷贝、创建Llama材料的衍生作品并对其进行修改。
- b. 再分发和使用
- i. 如果您分发或提供Llama材料(或其任何衍生作品),或包含其中任何内容的产品或服务(包括另一个AI模型),您应(A)随任何此类Llama材料提供本协议的副本;(B)在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示“Built with Llama”。如果您使用Llama材料或Llama材料的任何输出或结果来创建、训练、微调或以其他方式改进一个AI模型,并进行分发或提供,您还应在任何此类AI模型名称的开头包含“Llama”。
- ii. 如果您作为集成终端用户产品的一部分从被许可方处接收Llama材料或其任何衍生作品,则本协议第2条不适用于您。
- iii. 您必须在分发的所有Llama材料副本中保留以下归属声明,该声明应包含在作为此类副本一部分分发的“Notice”文本文件中:“Llama 3.2根据Llama 3.2社区许可协议获得许可,版权所有 © Meta Platforms, Inc. 保留所有权利。”
- iv. 您使用Llama材料必须遵守适用的法律法规(包括贸易合规法律法规),并遵守Llama材料的可接受使用政策(可在https://www.llama.com/llama3_2/use-policy 上获取),该政策特此通过引用并入本协议。
- 额外商业条款。如果在Llama 3.2版本发布日期,被许可方或其关联公司提供的产品或服务在前一个日历月的月活跃用户数超过7亿,则您必须向Meta请求许可,Meta可自行决定是否授予您许可,并且在Meta明确授予您此类权利之前,您无权行使本协议下的任何权利。
- 保修免责声明。除非适用法律要求,Llama材料及其任何输出和结果均按“现状”提供,不提供任何形式的保证,Meta明确否认所有形式的保证,包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您独自负责确定使用或再分发Llama材料的适当性,并承担与您使用Llama材料及其任何输出和结果相关的任何风险。
- 责任限制。在任何情况下,Meta或其关联公司均不对因本协议引起的任何责任理论(无论是合同、侵权、疏忽、产品责任还是其他)承担任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害赔偿责任,即使Meta或其关联公司已被告知此类损害赔偿的可能性。
- 知识产权
- a. 本协议未授予商标许可,并且在与Llama材料相关的情况下,除非为合理和惯常地描述和再分发Llama材料所需,或如本节5(a)所述,Meta和被许可方均不得使用对方或其任何关联公司拥有或关联的任何名称或标记。Meta特此授予您仅在遵守第1.b.i条最后一句的要求时使用“Llama”(“标记”)的许可。您将遵守Meta的品牌指南(目前可在https://about.meta.com/brand/resources/meta/company-brand/ 上获取)。因您使用该标记而产生的所有商誉将归Meta所有。
- b. 鉴于Meta对Llama材料及其衍生作品的所有权,对于您对Llama材料所做的任何衍生作品和修改,在您和Meta之间,您是且将是此类衍生作品和修改的所有者。
- c. 如果您对Meta或任何实体提起诉讼或其他法律程序(包括在诉讼中的反诉或反请求),声称Llama材料或Llama 3.2的输出或结果,或上述任何内容的任何部分,构成侵犯您拥有或可许可的知识产权或其他权利,则本协议授予您的任何许可将自该诉讼或索赔提起之日起终止。您将赔偿并使Meta免受任何第三方因您使用或分发Llama材料而产生或与之相关的任何索赔。
- 期限和终止。本协议的期限将自您接受本协议或访问Llama材料时开始,并将持续有效,直至根据本协议的条款和条件终止。如果您违反本协议的任何条款或条件,Meta可终止本协议。本协议终止后,您应删除并停止使用Llama材料。第3、4和7条在本协议终止后仍然有效。
- 适用法律和管辖权。本协议将受加利福尼亚州法律管辖并依其解释,不考虑法律选择原则,且《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。
Llama 3.2可接受使用政策
Meta致力于促进其工具和功能(包括Llama 3.2)的安全和公平使用。如果您访问或使用Llama 3.2,即表示您同意本可接受使用政策(“政策”)。本政策的最新版本可在https://www.llama.com/llama3_2/use-policy上找到。
禁止使用
我们希望每个人都能安全、负责任地使用Llama 3.2。您同意您不会使用或允许他人使用Llama 3.2进行以下行为:
- 违反法律或他人权利,包括:
- 从事、促进、生成、促成、鼓励、计划、煽动或进一步推动非法或违法活动或内容,例如:
- 暴力或恐怖主义
- 对儿童的剥削或伤害,包括招揽、创建、获取或传播儿童剥削内容,或未能报告儿童性虐待材料
- 人口贩运、剥削和性暴力
- 向未成年人非法分发信息或材料,包括淫秽材料,或未能对此类信息或材料采用法律要求的年龄限制
- 性招揽
- 任何其他犯罪活动
- 从事、促进、煽动或便利对个人或群体的骚扰、虐待、威胁或欺凌
- 从事、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为
- 从事未经授权或无执照的任何专业实践,包括但不限于金融、法律、医疗/健康或相关专业实践
- 收集、处理、披露、生成或推断个人的私人或敏感信息,包括个人身份、健康或人口统计信息,除非您已根据适用法律获得这样做的权利
- 从事或便利任何侵犯、盗用或以其他方式侵犯任何第三方权利的行为或生成任何内容,包括使用Llama材料的任何产品或服务的输出或结果
- 创建、生成或便利创建恶意代码、恶意软件、计算机病毒,或进行任何可能禁用、负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的行为
- 从事任何故意规避或移除使用限制或其他安全措施的行为,或启用Meta禁用的功能
- 从事、促进、生成、促成、鼓励、计划、煽动或进一步推动非法或违法活动或内容,例如:
- 从事、促进、煽动、便利或协助计划或开展对个人造成死亡或身体伤害风险的活动,包括与以下方面相关的Llama 3.2使用:
- 军事、战争、核工业或应用、间谍活动,用于受美国国务院维护的《国际武器贸易条例》(ITAR)约束的材料或活动,或受1989年《美国生物武器反恐法》或1997年《化学武器公约实施法》约束的活动
- 枪支和非法武器(包括武器开发)
- 非法药物和受管制/受控物质
- 关键基础设施、运输技术或重型机械的操作
- 自我伤害或伤害他人,包括自杀、自残和饮食失调
- 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容
- 故意欺骗或误导他人,包括与以下方面相关的Llama 3.2使用:
- 生成、促进或进一步推动欺诈或虚假信息的创建或传播
- 生成、促进或进一步推动诽谤性内容,包括创建诽谤性声明、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 表示Llama 3.2的使用或输出是人类生成的
- 生成或促进虚假的在线互动,包括虚假评论和其他虚假在线互动方式
- 未能向最终用户适当披露您的AI系统的任何已知危险
- 与旨在生成非法内容或从事非法或有害行为的第三方工具、模型或软件进行交互,和/或表示此类工具、模型或软件的输出与Meta或Llama 3.2相关联
对于Llama 3.2中包含的任何多模态模型,如果您是居住在欧盟的个人,或公司的主要营业地在欧盟,则Llama 3.2社区许可协议第1(a)条下授予的权利不适用于您。此限制不适用于包含任何此类多模态模型的产品或服务的最终用户。
请通过以下方式之一报告本政策的任何违反行为、软件“漏洞”或其他可能导致违反本政策的问题:
- 报告模型问题:https://github.com/meta-llama/llama-models/issues
- 报告模型生成的风险内容:developers.facebook.com/llama_output_feedback
- 报告漏洞和安全问题:facebook.com/whitehat/info
- 报告违反可接受使用政策或未经授权使用Llama 3.2的情况:LlamaUseReport@meta.com



