Llama 3.2-1B-Instruct开源多语言模型 - 免费部署助力对话、检索及摘要任务

首页

Llama 3.2 1B Instruct

由 meta-llama 开发

Llama 3.2是Meta开发的多语言大语言模型系列，包含1B和3B规模的预训练及指令调优生成模型，针对多语言对话场景优化，支持智能检索和摘要任务。

大型语言模型

Transformers

支持多种语言#多语言对话优化 #设备端量化推理 #128k长上下文

下载量 2.4M

发布时间 : 9/18/2024

模型简介

Llama 3.2纯文本指令调优模型针对多语言对话场景进行了优化，包括智能检索和摘要任务。在常见行业基准测试中，其表现优于许多开源和闭源聊天模型。

模型特点

多语言支持

支持8种官方语言，训练语言范围更广，可针对更多语言进行微调。

长上下文处理

支持128k的上下文长度，适合处理长文档和复杂对话场景。

高效推理

采用分组查询注意力（GQA）提升推理可扩展性，量化版本适合资源有限设备。

知识蒸馏

整合Llama 3.1 8B和70B模型的logits作为令牌级目标，通过知识蒸馏恢复剪枝后的性能。

模型能力

多语言文本生成

智能检索

文本摘要

对话系统

查询/提示重写

使用案例

智能助手

多语言聊天机器人

构建支持多种语言的对话助手，适用于全球用户。

在官方支持语言中表现优异

移动端AI写作助手

在移动设备上提供实时写作建议和内容生成。

量化版本适合资源有限设备

信息处理

知识检索

从大量文本中快速检索相关信息。

在阅读理解基准测试中表现良好

文本摘要

生成长文档的简洁摘要。

在TLDR9+测试中rougeL得分16.8-19.2

🚀 Llama 3.2 多语言大语言模型

Llama 3.2是一系列多语言大语言模型，提供1B和3B两种规格的预训练和指令微调生成模型。这些模型针对多语言对话场景进行了优化，适用于信息检索、摘要生成等任务，在行业基准测试中表现出色。

🚀 快速开始

本仓库包含两个版本的Llama-3.2-1B-Instruct，可分别与transformers库和原始的llama代码库配合使用。

使用transformers库

从transformers >= 4.43.0版本开始，你可以使用transformers库的pipeline抽象或Auto类的generate()函数进行对话推理。

请确保通过以下命令更新transformers库：

pip install --upgrade transformers

import torch
from transformers import pipeline

model_id = "meta-llama/Llama-3.2-1B-Instruct"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

更多关于如何在本地使用模型、使用torch.compile()、辅助生成、量化等详细方法，请参考huggingface-llama-recipes。

使用原始`llama`代码库

请遵循仓库中的说明进行操作。

使用以下命令下载原始检查点：

huggingface-cli download meta-llama/Llama-3.2-1B-Instruct --include "original/*" --local-dir Llama-3.2-1B-Instruct

✨ 主要特性

多语言支持：官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语，并且在更广泛的语言数据上进行了训练。
优化架构：采用优化的Transformer架构，微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF），以符合人类对有用性和安全性的偏好。
多种规格：提供1B和3B两种规格的模型，以及量化版本，适用于不同的计算资源和应用场景。

📦 安装指南

使用transformers库时，请确保通过以下命令更新transformers库：

pip install --upgrade transformers

💻 使用示例

基础用法

import torch
from transformers import pipeline

model_id = "meta-llama/Llama-3.2-1B-Instruct"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

高级用法

暂无高级用法示例，你可以参考huggingface-llama-recipes获取更多详细信息。

📚 详细文档

模型信息

属性	详情
模型开发者	Meta
模型架构	Llama 3.2是一种自回归语言模型，采用优化的Transformer架构。微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF）。
训练数据	公开可用的在线数据，最多包含9万亿个标记。对于1B和3B的Llama 3.2模型，在预训练阶段融入了Llama 3.1 8B和70B模型的逻辑。
参数	1B（1.23B）和3B（3.21B）
输入模态	多语言文本
输出模态	多语言文本和代码
上下文长度	128k（非量化版本），8k（量化版本）
GQA	是
共享嵌入	是
标记数量	最多9万亿个标记
知识截止日期	2023年12月
支持语言	英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语
模型发布日期	2024年9月25日
状态	基于离线数据集训练的静态模型，未来可能会发布改进版本。
许可证	Llama 3.2社区许可证
反馈	有关如何提供模型反馈或评论的说明，请参考Llama Models README。有关生成参数和如何在应用中使用Llama 3.2的更多技术信息，请访问此处。

预期用途

预期用例：适用于多种语言的商业和研究用途。指令微调的纯文本模型适用于类似助手的聊天和代理应用，如知识检索、摘要生成、移动AI写作助手以及查询和提示重写。预训练模型可用于各种自然语言生成任务，量化模型适用于计算资源有限的设备端应用。
超出范围：任何违反适用法律法规（包括贸易合规法律）的使用方式；违反可接受使用政策和Llama 3.2社区许可证的任何其他使用方式；使用本模型卡片中未明确支持的语言。

硬件和软件

训练因素：使用自定义训练库、Meta的自定义GPU集群和生产基础设施进行预训练。微调、量化、注释和评估也在生产基础设施上进行。
训练能源使用：在H100 - 80GB（TDP为700W）类型的硬件上累计使用了91.6万个GPU小时进行训练。
训练温室气体排放：估计基于位置的总温室气体排放量为240吨CO2eq，基于市场的总温室气体排放量为0吨CO2eq。

模型	训练时间（GPU小时）	逻辑生成时间（GPU小时）	训练功耗（W）	基于位置的训练温室气体排放（吨CO2eq）
Llama 3.2 1B	370k	-	700	107
Llama 3.2 3B	460k	-	700	133
Llama 3.2 1B SpinQuant	1.7	0	700	可忽略不计
Llama 3.2 3B SpinQuant	2.4	0	700	可忽略不计
Llama 3.2 1B QLora	1.3k	0	700	0.381
Llama 3.2 3B QLora	1.6k	0	700	0.461
总计	833k	86k		240

确定训练能源使用和温室气体排放的方法可参考此处。由于Meta公开发布这些模型，其他人不会产生训练能源使用和温室气体排放。

训练数据

Llama 3.2在最多9万亿个标记的公开可用数据上进行了预训练。对于1B和3B的Llama 3.2模型，在预训练阶段融入了Llama 3.1 8B和70B模型的逻辑，剪枝后使用知识蒸馏恢复性能。在训练后，采用与Llama 3.1类似的方法，通过多轮对齐生成最终的聊天模型，每轮包括监督微调（SFT）、拒绝采样（RS）和直接偏好优化（DPO）。预训练数据的截止日期为2023年12月。

量化

量化方案

当前的量化方案结合了PyTorch的ExecuTorch推理框架和Arm CPU后端，考虑了模型质量、预填充/解码速度和内存占用等指标。量化方案包括三个部分：

所有Transformer块中的线性层权重量化为4位分组方案（组大小为32），激活值采用8位逐令牌动态量化。
分类层的权重量化为8位逐通道，激活值采用8位逐令牌动态量化。
嵌入层采用8位逐通道量化。

量化感知训练和LoRA

量化感知训练（QAT）与低秩自适应（LoRA）模型仅在训练后阶段进行，使用与全精度模型相同的数据。初始化QAT时，利用监督微调（SFT）后获得的BF16 Llama 3.2模型检查点，并进行额外一轮的SFT训练。然后冻结QAT模型的主干，对Transformer块内的所有层应用LoRA适配器进行另一轮SFT训练，同时将LoRA适配器的权重和激活值保持在BF16。最后，使用直接偏好优化（DPO）对生成的模型（包括主干和LoRA适配器）进行微调。

SpinQuant

应用了SpinQuant和生成式训练后量化（GPTQ）。对于SpinQuant旋转矩阵微调，使用WikiText 2数据集中序列长度为2048的800个样本进行100次迭代优化。对于GPTQ，使用相同数据集中相同序列长度的128个样本。

基准测试 - 英文文本

基础预训练模型

类别	基准测试	样本数量	指标	Llama 3.2 1B	Llama 3.2 3B	Llama 3.1 8B
通用	MMLU	5	macro_avg/acc_char	32.2	58	66.7
	AGIEval English	3 - 5	average/acc_char	23.3	39.2	47.8
	ARC - Challenge	25	acc_char	32.8	69.1	79.7
阅读理解	SQuAD	1	em	49.2	67.7	77
	QuAC (F1)	1	f1	37.9	42.9	44.9
	DROP (F1)	3	f1	28.0	45.2	59.5
长上下文	Needle in Haystack	0	em	96.8	1	1

指令微调模型

能力	基准测试	样本数量	指标	Llama 3.2 1B bf16	Llama 3.2 1B Vanilla PTQ**	Llama 3.2 1B Spin Quant	Llama 3.2 1B QLoRA	Llama 3.2 3B bf16	Llama 3.2 3B Vanilla PTQ**	Llama 3.2 3B Spin Quant	Llama 3.2 3B QLoRA	Llama 3.1 8B
通用	MMLU	5	macro_avg/acc	49.3	43.3	47.3	49.0	63.4	60.5	62	62.4	69.4
重写	Open - rewrite eval	0	micro_avg/rougeL	41.6	39.2	40.9	41.2	40.1	40.3	40.8	40.7	40.9
摘要生成	TLDR9+ (test)	1	rougeL	16.8	14.9	16.7	16.8	19.0	19.1	19.2	19.1	17.2
指令遵循	IFEval	0	Avg(Prompt/Instruction acc Loose/Strict)	59.5	51.5	58.4	55.6	77.4	73.9	73.5	75.9	80.4
数学	GSM8K (CoT)	8	em_maj1@1	44.4	33.1	40.6	46.5	77.7	72.9	75.7	77.9	84.5
	MATH (CoT)	0	final_em	30.6	20.5	25.3	31.0	48.0	44.2	45.3	49.2	51.9
推理	ARC - C	0	acc	59.4	54.3	57	60.7	78.6	75.6	77.6	77.6	83.4
	GPQA	0	acc	27.2	25.9	26.3	25.9	32.8	32.8	31.7	33.9	32.8
	Hellaswag	0	acc	41.2	38.1	41.3	41.5	69.8	66.3	68	66.3	78.7
工具使用	BFCL V2	0	acc	25.7	14.3	15.9	23.7	67.0	53.4	60.1	63.5	67.1
	Nexus	0	macro_avg/acc	13.5	5.2	9.6	12.5	34.3	32.4	31.5	30.1	38.5
长上下文	InfiniteBench/En.QA	0	longbook_qa/f1	20.3	N/A	N/A	N/A	19.8	N/A	N/A	N/A	27.3
	InfiniteBench/En.MC	0	longbook_choice/acc	38.0	N/A	N/A	N/A	63.3	N/A	N/A	N/A	72.2
	NIH/Multi - needle	0	recall	75.0	N/A	N/A	N/A	84.7	N/A	N/A	N/A	98.8
多语言	MGSM (CoT)	0	em	24.5	13.7	18.2	24.4	58.2	48.9	54.3	56.8	68.9

注：**仅用于比较目的，该模型未发布。

多语言基准测试

类别	基准测试	语言	Llama 3.2 1B	Llama 3.2 1B Vanilla PTQ**	Llama 3.2 1B Spin Quant	Llama 3.2 1B QLoRA	Llama 3.2 3B	Llama 3.2 3B Vanilla PTQ**	Llama 3.2 3B Spin Quant	Llama 3.2 3B QLoRA	Llama 3.1 8B
通用	MMLU (5-shot, macro_avg/acc)	葡萄牙语	39.8	34.9	38.9	40.2	54.5	50.9	53.3	53.4	62.1
		西班牙语	41.5	36.0	39.8	41.8	55.1	51.9	53.6	53.6	62.5
		意大利语	39.8	34.9	38.1	40.6	53.8	49.9	52.1	51.7	61.6
		德语	39.2	34.9	37.5	39.6	53.3	50.0	52.2	51.3	60.6
		法语	40.5	34.8	39.2	40.8	54.6	51.2	53.3	53.3	62.3
		印地语	33.5	30.0	32.1	34.0	43.3	40.4	42.0	42.1	50.9
		泰语	34.7	31.2	32.4	34.9	44.5	41.3	44.0	42.2	50.3

注：**仅用于比较目的，该模型未发布。

推理时间

下表比较了不同量化方法（SpinQuant和QAT + LoRA）与BF16基线的性能指标。评估使用ExecuTorch框架作为推理引擎，以ARM CPU为后端，在Android OnePlus 12设备上进行。

类别	解码速度（令牌/秒）	首令牌生成时间（秒）	预填充速度（令牌/秒）	模型大小（PTE文件大小，MB）	内存大小（RSS，MB）
1B BF16（基线）	19.2	1.0	60.3	2358	3185
1B SpinQuant	50.2（2.6倍）	0.3（-76.9%）	260.5（4.3倍）	1083（-54.1%）	1921（-39.7%）
1B QLoRA	45.8（2.4倍）	0.3（-76.0%）	252.0（4.2倍）	1127（-52.2%）	2255（-29.2%）
3B BF16（基线）	7.6	3.0	21.2	6129	7419
3B SpinQuant	19.7（2.6倍）	0.7（-76.4%）	89.7（4.2倍）	2435（-60.3%）	3726（-49.8%）
3B QLoRA	18.5（2.4倍）	0.7（-76.1%）	88.8（4.2倍）	2529（-58.7%）	4060（-45.3%）

注：

解码速度（令牌/秒）表示持续生成的速度，数值越高越好。
首令牌生成时间（TTFT）表示为给定提示生成第一个令牌的速度，数值越低越好。
预填充速度是TTFT的倒数（即1/TTFT），单位为令牌/秒，数值越高越好。
模型大小通过ExecuTorch的二进制文件格式PTE文件来衡量。
RSS大小表示驻留集大小（RSS）的内存使用情况。

🔧 技术细节

责任与安全

Meta采用三管齐下的策略来管理信任和安全风险：

使开发者能够为其目标受众和Llama支持的用例部署有用、安全和灵活的体验。
保护开发者免受试图利用Llama功能造成潜在危害的恶意用户的攻击。
为社区提供保护，防止模型被滥用。

负责任的部署

方法：Llama是一种基础技术，可用于多种用例。Meta的Llama模型负责任部署的示例可在社区故事网页上找到。Meta的方法是构建最有用的模型，通过使模型安全适用于通用用例并解决一系列标准危害，让世界从技术力量中受益。开发者可以根据自己的用例定制安全策略，并在其Llama系统中部署必要的保障措施。Llama 3.2的开发遵循了负责任使用指南中概述的最佳实践。
Llama 3.2 Instruct：安全微调的主要目标是为研究社区提供研究安全微调鲁棒性的有价值资源，并为开发者提供一个随时可用、安全且强大的模型，以减少部署安全AI系统的工作量。实施了与Llama 3相同的安全缓解措施，更多信息可参考Llama 3 论文。采用多方面的数据收集方法，结合供应商提供的人工生成数据和合成数据，以减轻潜在的安全风险。开发了许多基于大语言模型（LLM）的分类器，以精心选择高质量的提示和响应，提高数据质量控制。在Llama 3的基础上，更加注重模型对良性提示的拒绝以及拒绝语气。在安全数据策略中包括了边界和对抗性提示，并修改了安全数据响应以遵循语气指南。
Llama 3.2系统：大型语言模型（包括Llama 3.2）不应单独部署，而应作为整体AI系统的一部分，并根据需要添加额外的安全护栏。开发者在构建代理系统时应部署系统保障措施。保障措施对于实现有用性和安全性的正确平衡以及减轻系统固有的安全和风险至关重要。作为负责任发布方法的一部分，Meta为社区提供了保障措施，开发者应将其与Llama模型或其他LLM一起部署，包括Llama Guard、Prompt Guard和Code Shield。所有参考实现演示默认包含这些保障措施，以便开发者可以直接受益于系统级安全。

新功能和用例

技术进步：Llama的发布通常会引入新功能，除了适用于所有生成式AI用例的最佳实践外，还需要进行特定考虑。对于Llama 3.2也支持的先前版本的功能，请参考Llama 3.1模型卡片，因为同样的考虑因素也适用于此处。
受限环境：Llama 3.2 1B和3B模型预计将部署在高度受限的环境中，如移动设备。使用较小模型的LLM系统与更复杂、更大的系统相比，将具有不同的对齐配置文件和安全性/有用性权衡。开发者应确保其系统的安全性满足其用例的要求。建议为此类用例使用更轻量级的系统保障措施，如Llama Guard 3 - 1B或其针对移动设备优化的版本。

评估

大规模评估：构建了专门的对抗性评估数据集，并评估了由Llama模型和Purple Llama保障措施组成的系统，以过滤输入提示和输出响应。在上下文中评估应用程序很重要，建议为你的用例构建专门的评估数据集。
红队测试：定期进行红队测试，目标是通过对抗性提示发现风险，并利用这些经验教训改进基准测试和安全调整数据集。早期与关键风险领域的主题专家合作，了解这些现实世界危害的性质以及此类模型如何可能对社会造成意外危害。根据这些对话，为红队制定了一组对抗性目标，例如提取有害信息或重新编程模型以潜在地造成危害。红队成员包括网络安全、对抗性机器学习、负责任AI和内容完整性方面的专家，以及具有特定地理市场内容完整性问题背景的多语言内容专家。

关键风险

除了上述安全工作外，Meta还特别关注测量和/或减轻以下关键风险领域：

CBRNE（化学、生物、放射、核和爆炸武器）：Llama 3.2 1B和3B模型是Llama 3.1的较小且能力较弱的衍生模型。对于Llama 3.1 70B和405B，为了评估与化学和生物武器扩散相关的风险，进行了提升测试，以评估使用Llama 3.1模型是否会显著提高恶意行为者计划或实施使用此类武器的攻击的能力，并确定此类测试也适用于较小的1B和3B模型。
儿童安全：使用专家团队进行儿童安全风险评估，以评估模型产生可能导致儿童安全风险的输出的能力，并通过微调提供必要和适当的风险缓解措施。利用这些专家红队测试会话，在Llama 3模型开发过程中扩大评估基准的覆盖范围。对于Llama 3，使用基于目标的方法进行了新的深入会话，以评估模型在多个攻击向量上的风险，包括Llama 3训练的其他语言。还与内容专家合作进行红队测试，评估潜在违规内容，同时考虑特定市场的细微差别或经验。
网络攻击：对于Llama 3.1 405B，网络攻击提升研究调查了LLM是否可以在技能水平和速度方面增强人类在黑客任务中的能力。攻击自动化研究专注于评估LLM作为自主代理在网络攻击行动中的能力，特别是在勒索软件攻击的背景下。此评估与之前将LLM视为交互式助手的研究不同，主要目标是评估这些模型是否可以在没有人类干预的情况下有效作为独立代理执行复杂的网络攻击。由于Llama 3.2的1B和3B模型比Llama 3.1 405B更小且能力较弱，Meta普遍认为对405B模型进行的测试也适用于Llama 3.2模型。

社区

行业合作：生成式AI安全需要专业知识和工具，Meta相信开放社区的力量可以加速其发展。Meta是开放联盟的积极成员，包括AI联盟、AI合作组织和MLCommons，积极为安全标准化和透明度做出贡献。鼓励社区采用MLCommons概念验证评估等分类法，以促进安全和内容评估的合作和透明度。Meta的Purple Llama工具已开源，供社区使用，并广泛分发给包括云服务提供商在内的生态系统合作伙伴。鼓励社区为Github仓库做出贡献。
资助计划：Meta设立了Llama影响资助计划，以识别和支持Meta的Llama模型在教育、气候和开放创新三个类别中对社会有益的最有吸引力的应用。数百份申请中的20名决赛选手可在此处找到。
报告机制：Meta建立了一套资源，包括输出报告机制和漏洞赏金计划，以不断改进Llama模型。

📄 许可证

使用Llama 3.2受Llama 3.2社区许可证（自定义商业许可协议）的约束。

Llama 3.2社区许可协议

协议概述

本协议规定了Llama 3.2材料的使用、复制、分发和修改的条款和条件。

定义

协议：指本协议中规定的Llama材料的使用、复制、分发和修改的条款和条件。
文档：指Meta在https://llama.meta.com/doc/overview 上分发的与Llama 3.2相关的规格、手册和文档。
被许可方或您：指您本人，或您的雇主，或任何其他个人或实体（如果您代表该个人或实体签订本协议），且该个人或实体达到适用法律法规要求的提供法律同意的年龄，并具有约束您的雇主或该其他个人或实体的法律权力。
Llama 3.2：指Meta在https://www.llama.com/llama-downloads 上分发的基础大语言模型、软件和算法，包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及上述内容的其他元素。
Llama材料：指Meta根据本协议提供的专有Llama 3.2和文档（及其任何部分）的统称。
Meta或我们：指Meta Platforms Ireland Limited（如果您位于欧洲经济区或瑞士，或者您是一家主要营业地位于欧洲经济区或瑞士的实体）和Meta Platforms, Inc.（如果您位于欧洲经济区或瑞士以外）。

许可权利和再分发

权利授予：您被授予在Meta的知识产权或其他权利下，对Llama材料进行非排他性、全球性、不可转让和免版税的有限许可，包括使用、复制、分发、拷贝、创作衍生作品和修改Llama材料的权利。
再分发和使用：
- 如果您分发或提供Llama材料（或其任何衍生作品），或包含这些材料的产品或服务（包括其他AI模型），您应（A）随任何此类Llama材料提供本协议的副本；（B）在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示“Built with Llama”。如果您使用Llama材料或其任何输出或结果来创建、训练、微调或以其他方式改进一个AI模型，并进行分发或提供，您还应在任何此类AI模型名称的开头包含“Llama”。
- 如果您作为集成终端用户产品的一部分从被许可方处接收Llama材料或其任何衍生作品，则本协议第2条不适用于您。
- 您必须在分发的所有Llama材料副本中，在作为副本一部分分发的“Notice”文本文件中保留以下归属声明：“Llama 3.2 is licensed under the Llama 3.2 Community License, Copyright © Meta Platforms, Inc. All Rights Reserved.”
- 您对Llama材料的使用必须符合适用的法律法规（包括贸易合规法律法规），并遵守Llama材料的可接受使用政策（可在https://www.llama.com/llama3_2/use-policy 上获取），该政策特此通过引用并入本协议。

额外商业条款

如果在Llama 3.2版本发布日期，被许可方或其附属公司提供的产品或服务的月活跃用户在前一个日历月超过7亿，则您必须向Meta请求许可，Meta可自行决定是否授予您许可。在Meta明确授予您此类权利之前，您无权行使本协议下的任何权利。

免责声明

除非适用法律要求，Llama材料及其任何输出和结果均按“现状”提供，不提供任何形式的保证。Meta明确放弃所有明示和暗示的保证，包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您独自负责确定使用或再分发Llama材料的适当性，并承担与使用Llama材料及其任何输出和结果相关的任何风险。

责任限制

在任何情况下，Meta或其附属公司均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、示范性或惩罚性损害承担责任，无论责任理论如何，即使Meta或其附属公司已被告知此类损害的可能性。

知识产权

商标许可：本协议未授予任何商标许可。与Llama材料相关，除非本协议第5(a)条规定或在描述和再分发Llama材料时进行合理和惯常使用所需，否则Meta和被许可方均不得使用对方或其任何附属公司拥有或关联的任何名称或标记。Meta特此授予您仅在遵守第1.b.i条最后一句的要求时使用“Llama”（“标记”）的许可。您将遵守Meta的品牌指南（目前可在https://about.meta.com/brand/resources/meta/company-brand/ 上获取）。因您使用标记而产生的所有商誉将归Meta所有。
衍生作品所有权：在Meta拥有Llama材料及其衍生作品的前提下，就您对Llama材料所做的任何衍生作品和修改而言，您是且将是此类衍生作品和修改的所有者。
侵权诉讼：如果您对Meta或任何实体提起诉讼或其他法律程序（包括诉讼中的反诉或反请求），声称Llama材料或Llama 3.2的输出或结果，或上述任何部分构成侵犯您拥有或可许可的知识产权或其他权利，则本协议授予您的任何许可将自此类诉讼或请求提起之日起终止。您将赔偿并使Meta免受任何第三方因您使用或分发Llama材料而产生或与之相关的索赔。

期限和终止

本协议的期限自您接受本协议或访问Llama材料之日起开始，并将持续有效，直至根据本协议的条款和条件终止。如果您违反本协议的任何条款或条件，Meta有权终止本协议。本协议终止后，您应删除并停止使用Llama材料。第3条、第4条和第7条在本协议终止后仍然有效。

适用法律和管辖权

本协议将受加利福尼亚州法律管辖并依其解释，不考虑法律选择原则，《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。

Llama 3.2可接受使用政策

Meta致力于促进其工具和功能（包括Llama 3.2）的安全和公平使用。如果您访问或使用Llama 3.2，您同意遵守本可接受使用政策（“政策”）。本政策的最新版本可在https://www.llama.com/llama3_2/use-policy上找到。

禁止使用情况

违反法律或他人权利：
- 从事、促进、生成、促成、鼓励、策划、煽动或进一步推动非法或违法活动或内容，例如：
  - 暴力或恐怖主义
  - 对儿童的剥削或伤害，包括招揽、创建、获取或传播儿童剥削内容，或未能报告儿童性虐待材料
  - 人口贩运、剥削和性暴力
  - 向未成年人非法分发信息或材料，包括淫秽材料，或未能对此类信息或材料实施法律要求的年龄限制
  - 性招揽
  - 任何其他犯罪活动
- 从事、促进、煽动或便利对个人或群体的骚扰、虐待、威胁或欺凌
- 从事、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供中进行歧视或其他非法或有害行为
- 从事未经授权或无执照的任何专业实践，包括但不限于金融、法律、医疗/健康或相关专业实践
- 收集、处理、披露、生成或推断个人的私人或敏感信息，包括个人身份、健康或人口统计信息，除非您已根据适用法律获得这样做的权利
- 从事或便利任何侵犯、挪用或以其他方式侵犯任何第三方权利的行为或生成任何内容，包括使用Llama材料的任何产品或服务的输出或结果
- 创建、生成或便利创建恶意代码、恶意软件、计算机病毒，或做任何可能禁用、负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的事情
- 从事任何故意规避或移除使用限制或其他安全措施的行为，或启用Meta禁用的功能
从事可能导致人员死亡或身体伤害的活动：
- 军事、战争、核工业或应用、间谍活动，用于受美国国务院维护的《国际武器贸易条例》（ITAR）或1989年《美国生物武器反恐法》或1997年《化学武器公约实施法》约束的材料或活动
- 枪支和非法武器（包括武器开发）
- 非法药物和受管制/受控物质
- 关键基础设施、运输技术或重型机械的操作
- 自我伤害或伤害他人，包括自杀、切割和饮食失调
- 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容
故意欺骗或误导他人：
- 生成、促进或进一步推动欺诈或虚假信息的创建或传播
- 生成、促进或进一步推动诽谤性内容，包括创建诽谤性声明、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 声称使用Llama 3.2或其输出是人类生成的
- 生成或促进虚假的在线互动，包括虚假评论和其他虚假在线互动方式
未能向最终用户适当披露AI系统的已知危险
与旨在生成非法内容或从事非法或有害行为的第三方工具、模型或软件进行交互，并/或声称此类工具、模型或软件的输出与Meta或Llama 3.2相关联