Llama 3.2开源大语言模型 - 免费支持8种语言，优化多语言对话体验

首页

Llama 3.2 1B Instruct QLORA INT4 EO8

由 meta-llama 开发

Llama 3.2 是 Meta 推出的多语言大语言模型系列，包含 1B 和 3B 参数的预训练和指令微调版本，支持 8 种官方语言，优化了多语言对话场景。

大型语言模型

PyTorch

支持多种语言#多语言对话优化 #指令微调生成 #GQA高效推理

下载量 286

发布时间 : 10/23/2024

模型简介

Llama 3.2 是针对多语言对话优化的生成模型，适用于知识检索、摘要等任务，采用优化的变压器架构和分组查询注意力技术。

模型特点

多语言支持

官方支持 8 种语言，实际训练语言更广泛，可微调支持更多语言

高效推理

采用分组查询注意力（GQA）技术提升推理可扩展性

安全优化

通过监督微调（SFT）和人类反馈强化学习（RLHF）确保输出符合安全标准

模型能力

多语言文本生成

智能对话

知识检索

文本摘要

查询重写

使用案例

智能助手

多语言聊天助手

支持多种语言的对话交互

在行业基准测试中优于多数开源/闭源聊天模型

移动端写作助手

帮助用户进行多语言内容创作

信息处理

知识检索

从文本数据中提取关键信息

文档摘要

生成多语言文本的简洁摘要

🚀 Llama 3.2 多语言大语言模型

Llama 3.2 是一系列多语言大语言模型，涵盖 1B 和 3B 规模的预训练和指令微调生成模型。它针对多语言对话场景进行了优化，在常见行业基准测试中表现出色，能有效应用于知识检索和摘要等任务。

🚀 快速开始

Llama 3.2 可用于商业和研究用途，支持多种语言。若你想使用该模型，需遵守 Llama 3.2 社区许可协议。

✨ 主要特性

多语言支持：官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语，且在更多语言上进行了训练。
优化架构：采用优化的变压器架构，微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF），以符合人类对有用性和安全性的偏好。
高效推理：所有模型版本均使用分组查询注意力（GQA），提升推理可扩展性。

📦 安装指南

文档未提及具体安装步骤，暂不提供。

💻 使用示例

文档未提供代码示例，暂不展示。

📚 详细文档

模型信息

Llama 3.2 多语言大语言模型集合包含 1B 和 3B 规模的预训练和指令微调生成模型（文本输入/文本输出）。指令微调的纯文本模型针对多语言对话用例进行了优化，包括智能检索和摘要任务，在常见行业基准测试中优于许多可用的开源和闭源聊天模型。

属性	详情
模型开发者	Meta
模型架构	Llama 3.2 是一种自回归语言模型，使用优化的变压器架构。微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF），以符合人类对有用性和安全性的偏好。
训练数据	公开可用的在线数据的新组合。
支持语言	官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。Llama 3.2 在比这 8 种支持语言更广泛的语言集合上进行了训练。开发者可根据 Llama 3.2 社区许可和可接受使用政策，对 Llama 3.2 模型进行微调以支持其他语言。
模型发布日期	2024 年 10 月 24 日
状态	这是一个在离线数据集上训练的静态模型。未来可能会发布改进模型能力和安全性的版本。
许可证	使用 Llama 3.2 受 Llama 3.2 社区许可协议（自定义商业许可协议）的约束。
反馈	有关如何提供对模型的反馈或评论的说明，请参阅 Llama 模型的 README。有关生成参数和如何在应用程序中使用 Llama 3.2 的技术信息，请访问此处。

预期用途

预期用例

Llama 3.2 旨在用于多种语言的商业和研究用途。指令微调的纯文本模型适用于类似助手的聊天和智能应用，如知识检索和摘要、移动 AI 写作助手以及查询和提示重写。预训练模型可用于各种自然语言生成任务。同样，量化模型可用于计算资源有限的各种设备端用例。

超出范围

以任何违反适用法律法规（包括贸易合规法律）的方式使用。
以任何违反可接受使用政策和 Llama 3.2 社区许可协议的方式使用。
在本模型卡中未明确提及支持的语言中使用。

硬件和软件

训练因素

预训练使用了自定义训练库、Meta 定制的 GPU 集群和生产基础设施。微调、量化、标注和评估也在生产基础设施上进行。

训练能源使用

根据下表，训练在 H100 - 80GB（TDP 为 700W）类型的硬件上累计使用了 916k GPU 小时的计算资源。训练时间是训练每个模型所需的总 GPU 时间，功耗是每个 GPU 设备使用的峰值功率容量，并根据功率使用效率进行了调整。

训练温室气体排放

训练估计的基于位置的总温室气体排放量为 240 吨 CO2eq。自 2020 年以来，Meta 在其全球运营中保持净零温室气体排放，并以可再生能源匹配其 100% 的电力使用；因此，训练的基于市场的总温室气体排放量为 0 吨 CO2eq。

	训练时间（GPU 小时）	对数生成时间（GPU 小时）	训练功耗（W）	训练基于位置的温室气体排放（吨 CO2eq）	训练基于市场的温室气体排放（吨 CO2eq）
Llama 3.2 1B	370k	-	700	-	-

Llama 3.2 社区许可协议

许可权利和再分发

权利授予：您被授予在 Llama 材料中体现的 Meta 知识产权或其他权利下的非排他性、全球范围、不可转让和免版税的有限许可，以使用、复制、分发、拷贝、创建衍生作品并对 Llama 材料进行修改。
再分发和使用：
- 若您分发或提供 Llama 材料（或其任何衍生作品），或包含其中任何内容的产品或服务（包括另一个 AI 模型），您应（A）随任何此类 Llama 材料提供本协议的副本；（B）在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示“Built with Llama”。若您使用 Llama 材料或其任何输出或结果来创建、训练、微调或以其他方式改进一个 AI 模型，并进行分发或提供，则您还应在任何此类 AI 模型名称的开头包含“Llama”。
- 若您作为集成终端用户产品的一部分从被许可方处接收 Llama 材料或其任何衍生作品，则本协议第 2 条不适用于您。
- 您必须在分发的所有 Llama 材料副本中，在作为此类副本一部分分发的“Notice”文本文件中保留以下归属声明：“Llama 3.2 依据 Llama 3.2 社区许可协议获得许可，版权所有 © Meta Platforms, Inc. 保留所有权利。”
- 您对 Llama 材料的使用必须符合适用法律法规（包括贸易合规法律法规），并遵守 Llama 材料的可接受使用政策（可在 https://www.llama.com/llama3_2/use-policy 获得），该政策特此通过引用并入本协议。

额外商业条款

若在 Llama 3.2 版本发布日期，被许可方或其关联方提供的产品或服务的月活跃用户在前一个日历月超过 7 亿月活跃用户，您必须向 Meta 请求许可，Meta 可自行决定是否授予您许可，并且在 Meta 另行明确授予您此类权利之前，您无权行使本协议下的任何权利。

免责声明

除非适用法律要求，Llama 材料及其任何输出和结果按“原样”提供，不提供任何形式的保证，Meta 明确排除所有形式的明示和暗示保证，包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您独自负责确定使用或再分发 Llama 材料的适当性，并承担与使用 Llama 材料及其任何输出和结果相关的任何风险。

责任限制

在任何情况下，Meta 或其关联方均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害承担责任，即使 Meta 或其关联方已被告知此类损害的可能性。

知识产权

本协议未授予商标许可，与 Llama 材料相关，除非为描述和再分发 Llama 材料的合理和惯常使用所必需，或如本节 5(a) 所述，Meta 和被许可方均不得使用对方或其任何关联方拥有或关联的任何名称或标记。Meta 特此授予您仅为遵守第 1.b.i 条最后一句所需的使用“Llama”（“标记”）的许可。您将遵守 Meta 的品牌指南（目前可在 https://about.meta.com/brand/resources/meta/company-brand/ 访问）。因您使用标记而产生的所有商誉将归属于 Meta 的利益。
受 Meta 对 Llama 材料及其为 Meta 制作的衍生作品的所有权约束，就您制作的 Llama 材料的任何衍生作品和修改而言，在您和 Meta 之间，您是并将是此类衍生作品和修改的所有者。
若您对 Meta 或任何实体提起诉讼或其他程序（包括诉讼中的交叉索赔或反诉），声称 Llama 材料或 Llama 3.2 的输出或结果，或其任何部分，构成侵犯您拥有或可许可的知识产权或其他权利，则本协议授予您的任何许可自此类诉讼或索赔提起之日起终止。您将赔偿并使 Meta 免受任何第三方因您使用或分发 Llama 材料而产生或与之相关的任何索赔。

期限和终止

本协议的期限自您接受本协议或访问 Llama 材料时开始，并将持续有效，直至根据本协议的条款和条件终止。若您违反本协议的任何条款或条件，Meta 可终止本协议。本协议终止后，您应删除并停止使用 Llama 材料。第 3、4 和 7 条在本协议终止后仍然有效。

适用法律和管辖权

本协议受加利福尼亚州法律管辖并依其解释，不考虑法律选择原则，《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。

Llama 3.2 可接受使用政策

Meta 致力于促进其工具和功能（包括 Llama 3.2）的安全和公平使用。若您访问或使用 Llama 3.2，即表示您同意本可接受使用政策（“政策”）。本政策的最新版本可在 https://www.llama.com/llama3_2/use-policy 找到。

禁止使用

违反法律或他人权利：
- 参与、促进、生成、促成、鼓励、策划、煽动或推动非法或违法活动或内容，例如：
  - 暴力或恐怖主义
  - 对儿童的剥削或伤害，包括招揽、创建、获取或传播儿童剥削内容或未报告儿童性虐待材料
  - 人口贩运、剥削和性暴力
  - 向未成年人非法分发信息或材料，包括淫秽材料，或未对此类信息或材料采用法律要求的年龄限制
  - 性招揽
  - 任何其他犯罪活动
- 参与、促进、煽动或便利对个人或群体的骚扰、虐待、威胁或欺凌
- 参与、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供中进行歧视或其他非法或有害行为
- 从事未经授权或无执照的任何专业实践，包括但不限于金融、法律、医疗/健康或相关专业实践
- 收集、处理、披露、生成或推断个人的私人或敏感信息，包括个人身份、健康或人口统计信息，除非您已根据适用法律获得这样做的权利
- 参与或便利任何侵犯、盗用或以其他方式侵犯任何第三方权利的行为或生成任何内容，包括使用 Llama 材料的任何产品或服务的输出或结果
- 创建、生成或便利创建恶意代码、恶意软件、计算机病毒或做任何其他可能禁用、负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的事情
- 参与或便利任何故意规避或移除使用限制或其他安全措施的行动，或启用 Meta 禁用的功能
从事有风险的活动：参与、促进、煽动、便利或协助策划或开展对个人生命或身体造成伤害风险的活动，包括与以下方面相关的 Llama 3.2 的使用：
- 军事、战争、核工业或应用、间谍活动、用于受美国国务院《国际武器贸易条例》（ITAR）约束的材料或活动，或用于 1989 年《美国生物武器反恐法》或 1997 年《化学武器公约实施法》约束的材料或活动
- 枪支和非法武器（包括武器开发）
- 非法药物和受管制/受控物质
- 关键基础设施、运输技术或重型机械的操作
- 自我伤害或伤害他人，包括自杀、自残和饮食失调
- 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容
故意欺骗或误导他人：包括与以下方面相关的 Llama 3.2 的使用：
- 生成、促进或推动欺诈或创建或推广虚假信息
- 生成、促进或推动诽谤性内容，包括创建诽谤性陈述、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 表示 Llama 3.2 的使用或输出是人类生成的
- 生成或便利虚假的在线互动，包括虚假评论和其他虚假在线互动方式
未适当披露风险：未能向最终用户适当披露您的 AI 系统的任何已知危险
与非法工具交互：与旨在生成非法内容或从事非法或有害行为的第三方工具、模型或软件进行交互，和/或表示此类工具、模型或软件的输出与 Meta 或 Llama 3.2 相关