Llama 3.2开源多语言大语言模型 - 支持多语言任务，性能超现有模型

首页

Llama 3.2 3B Instruct QLORA INT4 EO8

由 meta-llama 开发

Llama 3.2是Meta推出的多语言大语言模型，提供1B和3B两种参数规模，支持多种语言任务，性能优于现有开源和闭源模型。

大型语言模型

PyTorch

支持多种语言#多语言对话 #128k长文本处理 #轻量级部署

下载量 289

发布时间 : 10/23/2024

模型简介

Llama 3.2是一个优化的多语言大语言模型，适用于商业和研究用途，支持文本生成、知识检索和总结等任务。

模型特点

多语言支持

官方支持8种语言，并在更广泛的语言集上进行了训练。

优化架构

采用优化的Transformer架构，使用监督微调和基于人类反馈的强化学习。

高性能表现

在常见行业基准测试中，优于许多现有的开源和闭源聊天模型。

长上下文支持

支持128k的上下文长度，适用于长文本生成和理解任务。

模型能力

多语言文本生成

知识检索

文本总结

对话生成

查询重写

提示重写

使用案例

商业应用

移动AI写作助手

帮助用户生成和优化文本内容。

提高写作效率和质量。

知识检索系统

快速检索和总结相关信息。

提升信息获取效率。

研究应用

自然语言生成研究

用于研究多语言文本生成模型。

推动自然语言处理领域的发展。

🚀 Llama 3.2大语言模型

Llama 3.2是Meta推出的多语言大语言模型，提供1B和3B两种参数规模的预训练和指令微调生成模型。它在多语言对话、知识检索和总结等任务上表现出色，超越了许多开源和闭源聊天模型。

🚀 快速开始

Llama 3.2模型的使用需遵循Llama 3.2社区许可协议。若要使用该模型，可参考Llama模型的README获取反馈或评论说明，更多关于生成参数和在应用中使用Llama 3.2的技术信息可前往此处查看。

✨ 主要特性

多语言支持：官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语，且在更广泛的语言集上进行了训练。
优化架构：采用优化的Transformer架构，微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF），以符合人类对有用性和安全性的偏好。
高性能表现：在常见行业基准测试中，优于许多现有的开源和闭源聊天模型。

📚 详细文档

模型信息

属性	详情
模型开发者	Meta
模型架构	Llama 3.2是自回归语言模型，使用优化的Transformer架构。微调版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF）。
训练数据	公开可用的在线数据的新组合
模型参数	1B（1.23B）、3B（3.21B）
输入模态	多语言文本
输出模态	多语言文本和代码
上下文长度	Llama 3.2（文本）：128k；Llama 3.2量化（文本）：8k
GQA	是
共享嵌入	是
令牌计数	最多9T令牌
知识截止日期	2023年12月
支持语言	英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语
模型发布日期	2024年10月24日
状态	基于离线数据集训练的静态模型，未来可能发布改进版本
许可证	Llama 3.2社区许可协议

预期用途

预期用例：适用于多语言的商业和研究用途。指令微调的纯文本模型适用于类似助手的聊天和代理应用，如知识检索和总结、移动AI写作助手以及查询和提示重写。预训练模型可用于各种自然语言生成任务，量化模型可用于计算资源有限的设备端用例。
超出范围：禁止以任何违反适用法律法规（包括贸易合规法律）的方式使用，禁止违反可接受使用政策和Llama 3.2社区许可协议的使用，禁止在本模型卡未明确支持的语言中使用。

硬件和软件

训练因素：使用自定义训练库、Meta定制的GPU集群和生产基础设施进行预训练，微调、量化、注释和评估也在生产基础设施上进行。
训练能源使用：在H100 - 80GB（TDP为700W）类型的硬件上累计使用了916k GPU小时进行训练。
训练温室气体排放：基于位置的估计总温室气体排放量为240吨CO2eq，基于市场的总温室气体排放量为0吨CO2eq。

	训练时间（GPU小时）	对数生成时间（GPU小时）	训练功耗（W）	基于位置的训练温室气体排放（吨CO2eq）	基于市场的训练温室气体排放（吨CO2eq）
Llama 3.2 1B	370k	-	700	-	-

Llama 3.2社区许可协议

LLAMA 3.2社区许可协议

Llama 3.2版本发布日期：2024年9月25日

“协议”指本协议中规定的关于使用、复制、分发和修改Llama材料的条款和条件。

“文档”指Meta在https://llama.meta.com/doc/overview 上分发的随Llama 3.2附带的规格、手册和文档。

“被许可方”或“您”指您，或您的雇主，或任何其他个人或实体（如果您代表该个人或实体签订本协议），且该个人或实体达到适用法律、规则或法规要求的提供法律同意的年龄，并且如果您代表他们签订本协议，具有约束您的雇主或该其他个人或实体的法律权力。

“Llama 3.2”指基础大语言模型、软件和算法，包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及Meta在https://www.llama.com/llama-downloads 上分发的上述其他元素。

“Llama材料”指根据本协议提供的Meta专有的Llama 3.2和文档（及其任何部分）的统称。

“Meta”或“我们”指Meta Platforms Ireland Limited（如果您位于欧洲经济区或瑞士，或者如果您是一个实体，您的主要营业地位于欧洲经济区或瑞士）和Meta Platforms, Inc.（如果您位于欧洲经济区或瑞士以外）。

通过点击下方的“我接受”，或使用或分发Llama材料的任何部分或元素，您同意受本协议的约束。

许可权利和再分发
- 权利授予：您被授予在Llama材料中体现的Meta知识产权或Meta拥有的其他权利下的非排他性、全球性、不可转让且免版税的有限许可，以使用、复制、分发、拷贝、创作衍生作品并对Llama材料进行修改。
- 再分发和使用
  - 如果您分发或提供Llama材料（或其任何衍生作品），或包含其中任何内容的产品或服务（包括另一个AI模型），您应（A）随任何此类Llama材料提供本协议的副本；（B）在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示“Built with Llama”。如果您使用Llama材料或Llama材料的任何输出或结果来创建、训练、微调或以其他方式改进一个AI模型，并进行分发或提供，您还应在任何此类AI模型名称的开头包含“Llama”。
  - 如果您作为集成终端用户产品的一部分从被许可方处接收Llama材料或其任何衍生作品，则本协议第2条不适用于您。
  - 您必须在分发的所有Llama材料副本中，在作为此类副本一部分分发的“通知”文本文件中保留以下归属声明：“Llama 3.2根据Llama 3.2社区许可协议获得许可，版权所有© Meta Platforms, Inc.保留所有权利。”
  - 您对Llama材料的使用必须符合适用的法律法规（包括贸易合规法律法规），并遵守Llama材料的可接受使用政策（可在https://www.llama.com/llama3_2/use-policy 上获取），该政策特此通过引用并入本协议。
额外商业条款：如果在Llama 3.2版本发布日期，被许可方或被许可方关联公司提供的产品或服务的月活跃用户在前一个日历月超过7亿月活跃用户，您必须向Meta请求许可，Meta可自行决定是否授予您许可，并且在Meta明确授予您此类权利之前，您无权行使本协议下的任何权利。
保修免责声明：除非适用法律要求，Llama材料及其任何输出和结果按“现状”提供，不提供任何形式的保证，Meta否认所有明示和暗示的保证，包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您独自负责确定使用或再分发Llama材料的适当性，并承担与您使用Llama材料及其任何输出和结果相关的任何风险。
责任限制：在任何情况下，Meta或其关联公司均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、示范性或惩罚性损害承担责任，无论责任理论如何，即使Meta或其关联公司已被告知任何上述损害的可能性。
知识产权
- 本协议未授予商标许可，与Llama材料相关，除非在描述和再分发Llama材料时合理和惯常使用所需，或如本节5(a)所述，Meta和被许可方均不得使用对方或其任何关联公司拥有或关联的任何名称或标记。Meta特此授予您仅为遵守第1.b.i条最后一句的要求使用“Llama”（“标记”）的许可。您将遵守Meta的品牌指南（目前可在https://about.meta.com/brand/resources/meta/company-brand/ 上获取）。因您使用标记而产生的所有商誉将归属于Meta。
- 鉴于Meta对Llama材料及其为Meta制作的衍生作品的所有权，就您制作的Llama材料的任何衍生作品和修改而言，在您和Meta之间，您是并将是此类衍生作品和修改的所有者。
- 如果您对Meta或任何实体提起诉讼或其他程序（包括诉讼中的交叉索赔或反诉），声称Llama材料或Llama 3.2的输出或结果，或上述任何部分构成侵犯您拥有或可许可的知识产权或其他权利，则本协议授予您的任何许可将自此类诉讼或索赔提起之日起终止。您将赔偿并使Meta免受因您使用或分发Llama材料而引起的或与之相关的任何第三方索赔。
期限和终止：本协议的期限将自您接受本协议或访问Llama材料时开始，并将持续有效，直至根据本协议的条款和条件终止。如果您违反本协议的任何条款或条件，Meta可终止本协议。本协议终止后，您应删除并停止使用Llama材料。第3、4和7条在本协议终止后仍然有效。
适用法律和管辖权：本协议受加利福尼亚州法律管辖和解释，不考虑法律选择原则，《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。

Llama 3.2可接受使用政策

Meta致力于促进其工具和功能（包括Llama 3.2）的安全和公平使用。如果您访问或使用Llama 3.2，您同意本可接受使用政策（“政策”）。本政策的最新版本可在https://www.llama.com/llama3_2/use-policy上找到。

禁止使用

违法或侵犯他人权利：您同意不使用或允许他人使用Llama 3.2从事、促进、生成、促成、鼓励、策划、煽动或进一步实施非法或违法活动或内容，例如暴力或恐怖主义、对儿童的剥削或伤害、人口贩运、性暴力、向未成年人非法分发信息或材料、性招揽、任何其他犯罪活动等；从事、促进、煽动或便利对个人或群体的骚扰、虐待、威胁或欺凌；从事、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为；从事未经授权或无执照的任何专业实践；收集、处理、披露、生成或推断个人的私人或敏感信息，除非您已根据适用法律获得这样做的权利；从事或便利任何侵犯、盗用或以其他方式侵犯任何第三方权利的行为或生成任何内容；创建、生成或便利创建恶意代码、恶意软件、计算机病毒或做任何可能禁用、负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的事情；从事任何故意规避或移除使用限制或其他安全措施的行为，或启用Meta禁用的功能。
存在人身伤害风险的活动：从事、促进、煽动、便利或协助策划或开展对个人存在死亡或身体伤害风险的活动，包括与军事、战争、核工业或应用、间谍活动、受美国国务院《国际武器贸易条例》（ITAR）约束的材料或活动、枪支和非法武器、非法药物和受管制/受控物质、关键基础设施运营、运输技术或重型机械、自我伤害或伤害他人、任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容相关的Llama 3.2使用。
欺骗或误导他人：故意欺骗或误导他人，包括生成、促进或进一步实施欺诈或创建或促进虚假信息；生成、促进或进一步传播诽谤性内容；生成、促进或进一步分发垃圾邮件；未经同意、授权或合法权利冒充他人；表示Llama 3.2的使用或输出是人类生成的；生成或便利虚假的在线互动。
未适当披露风险：未能向最终用户适当披露您的AI系统的任何已知危险。
与非法工具交互：与旨在生成非法内容或从事非法或有害行为的第三方工具、模型或软件进行交互，并/或表示此类工具、模型或软件的输出与Meta或Llama 3.2相关联。

对于Llama 3.2中包含的任何多模态模型，如果您是居住在欧盟的个人，或主要营业地在欧盟的公司，则不授予您Llama 3.2社区许可协议第1(a)条下的权利。此限制不适用于包含任何此类多模态模型的产品或服务的最终用户。

请通过以下方式之一报告本政策的任何违反行为、软件“漏洞”或其他可能导致违反本政策的问题：

报告模型问题：https://github.com/meta-llama/llama-models/issues
报告模型生成的风险内容：developers.facebook.com/llama_output_feedback
报告漏洞和安全问题：facebook.com/whitehat/info
报告违反可接受使用政策或未经授权使用Llama 3.2的行为：LlamaUseReport@meta.com

额外门控信息

如果您需要访问Llama 3.2模型，需要提供以下信息：

信息	类型
名字	文本
姓氏	文本
出生日期	日期选择器
国家	国家选择
所属机构	文本
职位	选择（学生、研究毕业生、AI研究员、AI开发者/工程师、记者、其他）
地理位置	IP定位