Llama-3.2-3B-Instruct开源多语言大模型 - 优化对话场景免费用！

首页

Llama 3.2 3B Instruct

由 alpindale 开发

Llama 3.2 是 Meta 推出的多语言大语言模型集合，包含 1B 和 3B 大小的预训练和指令调优生成模型。它针对多语言对话用例进行了优化，在常见行业基准测试中表现出色。

大型语言模型

Transformers

支持多种语言#多语言对话优化 #128k长上下文 #商业级RLHF调优

下载量 1,691

发布时间 : 9/25/2024

模型简介

Llama 3.2 是一种自回归语言模型，使用优化的变压器架构，支持多种语言，适用于商业和研究用途。

模型特点

多语言支持

官方支持 8 种语言，并在更广泛的语言集合上进行了训练。

优化架构

采用优化的变压器架构，调优版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF）。

高性能表现

在常见行业基准测试中，优于许多现有的开源和闭源聊天模型。

长上下文支持

支持 128k 的上下文长度。

模型能力

多语言文本生成

知识检索

文本总结

移动 AI 写作助手

查询和提示重写

使用案例

聊天和代理应用程序

多语言聊天助手

用于类似助手的聊天和代理应用程序。

支持多种语言的流畅对话。

知识检索

从大量文本中检索相关信息。

高效准确地提供所需信息。

文本生成

文本总结

生成长文本的简洁总结。

保留关键信息的同时大幅缩短文本。

写作助手

帮助用户生成高质量的文本内容。

提高写作效率和质量。

🚀 Llama 3.2 多语言大语言模型

Llama 3.2 是 Meta 推出的多语言大语言模型集合，包含 1B 和 3B 大小的预训练和指令调优生成模型。它针对多语言对话用例进行了优化，在常见行业基准测试中表现出色，能为商业和研究领域提供强大的语言处理能力。

🚀 快速开始

使用 `transformers` 库

从 transformers >= 4.43.0 版本开始，你可以使用 Transformers 的 pipeline 抽象或利用 Auto 类的 generate() 函数进行对话推理。

确保通过以下命令更新你的 transformers 库：

pip install --upgrade transformers

以下是一个使用示例：

import torch
from transformers import pipeline

model_id = "meta-llama/Llama-3.2-3B-Instruct"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

注意：你还可以在 huggingface-llama-recipes 中找到如何在本地使用模型、使用 torch.compile()、辅助生成、量化等详细方法。

使用 `llama` 代码库

请遵循仓库中的说明。

要下载原始检查点，请参考以下使用 huggingface-cli 的示例命令：

huggingface-cli download meta-llama/Llama-3.2-3B-Instruct --include "original/*" --local-dir Llama-3.2-3B-Instruct

✨ 主要特性

多语言支持：官方支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语，并且在更广泛的语言集合上进行了训练。
优化架构：采用优化的变压器架构，调优版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF），以符合人类对有用性和安全性的偏好。
高性能表现：在常见行业基准测试中，优于许多现有的开源和闭源聊天模型。

📦 安装指南

使用 `transformers` 库

确保通过以下命令更新你的 transformers 库：

pip install --upgrade transformers

💻 使用示例

基础用法

import torch
from transformers import pipeline

model_id = "meta-llama/Llama-3.2-3B-Instruct"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

📚 详细文档

模型信息

属性	详情
模型开发者	Meta
模型架构	Llama 3.2 是一种自回归语言模型，使用优化的变压器架构。调优版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF），以符合人类对有用性和安全性的偏好。
训练数据	公开可用的在线数据的新组合。
参数	1B（1.23B）和 3B（3.21B）
输入模态	多语言文本
输出模态	多语言文本和代码
上下文长度	128k
GQA	是
共享嵌入	是
令牌计数	最多 9T 令牌
知识截止日期	2023 年 12 月
支持语言	英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。Llama 3.2 在比这 8 种支持语言更广泛的语言集合上进行了训练。开发者可以根据 Llama 3.2 社区许可证和可接受使用政策，对 Llama 3.2 模型进行微调以支持其他语言。
模型发布日期	2024 年 9 月 25 日
状态	这是一个在离线数据集上训练的静态模型。未来可能会发布改进模型能力和安全性的版本。
许可证	Llama 3.2 的使用受 Llama 3.2 社区许可证（自定义商业许可协议）的约束。
反馈	有关如何提供对模型的反馈或评论的说明，请参阅模型 README。有关生成参数和如何在应用程序中使用 Llama 3.2 的更多技术信息，请访问此处。

预期用途

预期用例

Llama 3.2 旨在用于多种语言的商业和研究用途。指令调优的纯文本模型适用于类似助手的聊天和代理应用程序，如知识检索和总结、移动 AI 写作助手以及查询和提示重写。预训练模型可用于各种其他自然语言生成任务。

超出范围

以任何违反适用法律法规（包括贸易合规法律）的方式使用。
以可接受使用政策和 Llama 3.2 社区许可证禁止的任何其他方式使用。
在本模型卡中未明确提及为支持的语言中使用。

硬件和软件

训练因素：使用自定义训练库、Meta 定制的 GPU 集群和生产环境。

📄 许可证

LLAMA 3.2 社区许可协议

Llama 3.2 版本发布日期：2024 年 9 月 25 日

“协议”指本协议中规定的使用、复制、分发和修改 Llama 材料的条款和条件。

“文档”指 Meta 在 https://llama.meta.com/doc/overview 上分发的随 Llama 3.2 附带的规格、手册和文档。

“被许可方”或“您”指您，或您的雇主或任何其他人或实体（如果您代表该人或实体签订本协议），且您已达到适用法律、规则或法规要求的提供法律同意的年龄，并且如果您代表您的雇主或其他人员或实体签订本协议，您具有约束他们的法律权力。

“Llama 3.2”指基础大语言模型、软件和算法，包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及 Meta 在 https://www.llama.com/llama-downloads 上分发的上述内容的其他元素。

“Llama 材料”指 Meta 根据本协议提供的专有 Llama 3.2 和文档（及其任何部分）的统称。

“Meta”或“我们”指 Meta Platforms Ireland Limited（如果您位于欧洲经济区或瑞士，或者如果您是一个实体，您的主要营业地位于欧洲经济区或瑞士）和 Meta Platforms, Inc.（如果您位于欧洲经济区或瑞士以外）。

通过点击下面的“我接受”，或使用或分发 Llama 材料的任何部分或元素，您同意受本协议的约束。

许可权利和再分发
- a. 权利授予：您被授予在 Meta 体现在 Llama 材料中的知识产权或其他权利下的非排他性、全球性、不可转让且免版税的有限许可，以使用、复制、分发、拷贝、创作衍生作品以及对 Llama 材料进行修改。
- b. 再分发和使用
  - i. 如果您分发或提供 Llama 材料（或其任何衍生作品），或包含其中任何内容的产品或服务（包括另一个 AI 模型），您应（A）随任何此类 Llama 材料提供本协议的副本；并且（B）在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示“Built with Llama”。如果您使用 Llama 材料或 Llama 材料的任何输出或结果来创建、训练、微调或以其他方式改进一个 AI 模型，并进行分发或提供，您还应在任何此类 AI 模型名称的开头包含“Llama”。
  - ii. 如果您作为集成终端用户产品的一部分从被许可方处接收 Llama 材料或其任何衍生作品，则本协议第 2 条不适用于您。
  - iii. 您必须在您分发的所有 Llama 材料副本中，在作为此类副本一部分分发的“Notice”文本文件中保留以下归属声明：“Llama 3.2 按照 Llama 3.2 社区许可证获得许可，版权所有 © Meta Platforms, Inc. 保留所有权利。”
  - iv. 您对 Llama 材料的使用必须遵守适用的法律法规（包括贸易合规法律法规），并遵守 Llama 材料的可接受使用政策（可在 https://www.llama.com/llama3_2/use-policy 上获取），该政策特此通过引用并入本协议。
额外商业条款：如果在 Llama 3.2 版本发布日期，被许可方或被许可方的关联方提供的产品或服务的月活跃用户在前一个日历月超过 7 亿月活跃用户，您必须向 Meta 请求许可，Meta 可自行决定是否授予您许可，并且在 Meta 明确授予您此类权利之前，您无权行使本协议下的任何权利。
保修免责声明：除非适用法律要求，Llama 材料及其任何输出和结果按“现状”提供，不提供任何形式的保证，Meta 明确排除所有明示和暗示的保证，包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您独自负责确定使用或再分发 Llama 材料的适当性，并承担使用 Llama 材料及其任何输出和结果的相关风险。
责任限制：在任何情况下，Meta 或其关联方均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害承担责任，无论责任理论如何，包括合同、侵权、疏忽、产品责任或其他，即使 Meta 或其关联方已被告知此类损害的可能性。
知识产权
- a. 本协议未授予商标许可，关于 Llama 材料，除非为描述和再分发 Llama 材料的合理和惯常使用所需，或如本节 5(a) 所述，Meta 和被许可方均不得使用对方或其任何关联方拥有或关联的任何名称或标记。Meta 特此授予您仅为遵守第 1.b.i 条最后一句所需使用“Llama”（“标记”）的许可。您将遵守 Meta 的品牌指南（目前可在 https://about.meta.com/brand/resources/meta/company-brand/ 上获取）。因您使用标记而产生的所有商誉归 Meta 所有。
- b. 鉴于 Meta 对 Llama 材料及其衍生作品的所有权，关于您对 Llama 材料所做的任何衍生作品和修改，在您和 Meta 之间，您是并将是此类衍生作品和修改的所有者。
- c. 如果您对 Meta 或任何实体提起诉讼或其他程序（包括诉讼中的交叉索赔或反诉），声称 Llama 材料或 Llama 3.2 的输出或结果，或上述任何部分构成侵犯您拥有或可许可的知识产权或其他权利，则本协议授予您的任何许可自此类诉讼或索赔提起之日起终止。您将赔偿并使 Meta 免受因您使用或分发 Llama 材料而引起的或与之相关的任何第三方索赔。
期限和终止：本协议的期限自您接受本协议或访问 Llama 材料之日起开始，并将持续有效，直至根据本协议的条款和条件终止。如果您违反本协议的任何条款和条件，Meta 可终止本协议。本协议终止后，您应删除并停止使用 Llama 材料。第 3、4 和 7 条在本协议终止后仍然有效。
适用法律和管辖权：本协议受加利福尼亚州法律管辖并依其解释，不考虑法律选择原则，《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。

Llama 3.2 可接受使用政策

Meta 致力于促进其工具和功能（包括 Llama 3.2）的安全和公平使用。如果您访问或使用 Llama 3.2，您同意本可接受使用政策（“政策”）。本政策的最新版本可在 https://www.llama.com/llama3_2/use-policy 上找到。

禁止使用

我们希望每个人都能安全、负责任地使用 Llama 3.2。您同意您不会使用或允许他人使用 Llama 3.2 进行以下行为：

违反法律或他人权利，包括：
- 从事、促进、生成、促成、鼓励、策划、煽动或推动非法或违法活动或内容，例如：
  - 暴力或恐怖主义
  - 对儿童的剥削或伤害，包括招揽、创建、获取或传播儿童剥削内容或未报告儿童性虐待材料
  - 人口贩运、剥削和性暴力
  - 向未成年人非法分发信息或材料，包括淫秽材料，或未对此类信息或材料采用法律要求的年龄限制
  - 性招揽
  - 任何其他犯罪活动
- 从事、促进、煽动或便利对个人或群体的骚扰、虐待、威胁或欺凌
- 从事、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为
- 从事未经授权或无执照的任何专业实践，包括但不限于金融、法律、医疗/健康或相关专业实践
- 收集、处理、披露、生成或推断个人的私人或敏感信息，包括个人身份、健康或人口统计信息，除非您已根据适用法律获得这样做的权利
- 从事或便利任何侵犯、挪用或以其他方式侵犯任何第三方权利的行为或生成任何内容，包括使用 Llama 材料的任何产品或服务的输出或结果
- 创建、生成或便利创建恶意代码、恶意软件、计算机病毒或做任何其他可能禁用、负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的事情
- 从事任何故意规避或移除使用限制或其他安全措施的行为，或便利任何此类行为，或启用 Meta 禁用的功能
从事、促进、煽动、便利或协助策划或开展对个人造成死亡或身体伤害风险的活动，包括与以下方面相关的 Llama 3.2 的使用：
- 军事、战争、核工业或应用、间谍活动、用于受美国国务院维护的《国际武器贸易条例》（ITAR）约束的材料或活动，或受 1989 年《美国生物武器反恐法》或 1997 年《化学武器公约实施法》约束的材料或活动
- 枪支和非法武器（包括武器开发）
- 非法药物和受管制/受控物质
- 关键基础设施、运输技术或重型机械的操作
- 自我伤害或对他人的伤害，包括自杀、自残和饮食失调
- 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容
故意欺骗或误导他人，包括与以下方面相关的 Llama 3.2 的使用：
- 生成、促进或推动欺诈或虚假信息的创建或推广
- 生成、促进或推动诽谤性内容，包括创建诽谤性声明、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 表示 Llama 3.2 的使用或输出是人类生成的
- 生成或便利虚假的在线互动，包括虚假评论和其他虚假在线互动方式
未能向最终用户适当披露您的 AI 系统的任何已知危险
与旨在生成非法内容或从事非法或有害行为的第三方工具、模型或软件进行交互，并/或表示此类工具、模型或软件的输出与 Meta 或 Llama 3.2 相关联

对于 Llama 3.2 中包含的任何多模态模型，如果您是居住在欧盟的个人或主要营业地在欧盟的公司，则本 Llama 3.2 社区许可协议第 1(a) 条授予的权利不适用于您。此限制不适用于包含任何此类多模态模型的产品或服务的最终用户。

请通过以下方式之一报告任何违反本政策、软件“漏洞”或其他可能导致违反本政策的问题：

报告模型问题：https://github.com/meta-llama/llama-models/issues
报告模型生成的风险内容：developers.facebook.com/llama_output_feedback
报告漏洞和安全问题：facebook.com/whitehat/info
报告违反可接受使用政策或未经授权使用 Llama 3.2 的情况：LlamaUseReport@meta.com

额外门控信息

您提供的信息将根据 Meta 隐私政策进行收集、存储、处理和共享。

额外门控字段	类型
名字	文本
姓氏	文本
出生日期	日期选择器
国家	国家选择
所属机构	文本
职位	选择（学生、研究毕业生、AI 研究员、AI 开发者/工程师、记者、其他）
地理位置	IP 定位