Llama-2-7b-chat-hf-Q4_K_M-GGUF开源聊天模型

Home

Llama 2 7b Chat Hf Q4 K M GGUF

Developed by matrixportal

Meta发布的Llama 2系列7B参数聊天模型GGUF量化版本，适用于本地部署和推理

大型语言模型 English#量化轻量版 #本地化部署 #对话优化

Downloads 220

Release Time : 11/22/2024

Model Overview

基于Llama 2架构优化的对话模型，支持文本生成任务，经过4-bit量化处理以降低硬件需求

Model Features

量化压缩

采用GGUF格式的4-bit量化(Q4_K_M)，显著减少模型体积和内存占用

本地部署

支持通过llama.cpp在本地设备运行，无需云端依赖

对话优化

专门针对对话场景微调的7B参数模型，平衡性能与资源消耗

Model Capabilities

开放域对话

指令跟随

上下文理解

多轮对话

Use Cases

智能助手

个人知识问答

部署为本地知识库接口，保护隐私的同时提供信息查询

开发测试

模型原型开发

用于快速验证对话系统原型，降低开发硬件门槛

🚀 matrixportal/Llama-2-7b-chat-hf-Q4_K_M-GGUF

本模型是通过llama.cpp，利用ggml.ai的GGUF-my-repo空间，从meta-llama/Llama-2-7b-chat-hf转换为GGUF格式的。如需了解该模型的更多详细信息，请参考原始模型卡片。

🚀 快速开始

使用llama.cpp

可通过brew（适用于Mac和Linux）安装llama.cpp。

brew install llama.cpp

可以调用llama.cpp服务器或命令行界面（CLI）。

命令行界面（CLI）：

llama-cli --hf-repo matrixportal/Llama-2-7b-chat-hf-Q4_K_M-GGUF --hf-file llama-2-7b-chat-hf-q4_k_m.gguf -p "The meaning to life and the universe is"

服务器：

llama-server --hf-repo matrixportal/Llama-2-7b-chat-hf-Q4_K_M-GGUF --hf-file llama-2-7b-chat-hf-q4_k_m.gguf -c 2048

注意：你也可以直接按照Llama.cpp仓库中列出的使用步骤来使用此检查点。

步骤1：从GitHub克隆llama.cpp。

git clone https://github.com/ggerganov/llama.cpp

步骤2：进入llama.cpp文件夹，并使用LLAMA_CURL=1标志以及其他特定于硬件的标志（例如，在Linux上使用Nvidia GPU时使用LLAMA_CUDA=1）进行编译。

cd llama.cpp && LLAMA_CURL=1 make

步骤3：通过主二进制文件运行推理。

./llama-cli --hf-repo matrixportal/Llama-2-7b-chat-hf-Q4_K_M-GGUF --hf-file llama-2-7b-chat-hf-q4_k_m.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo matrixportal/Llama-2-7b-chat-hf-Q4_K_M-GGUF --hf-file llama-2-7b-chat-hf-q4_k_m.gguf -c 2048

额外的门禁信息

访问模型要求

你需要与Meta共享联系信息才能访问此模型。

LLAMA 2社区许可协议

“协议”指的是本文中规定的关于使用、复制、分发和修改Llama材料的条款和条件。 “文档”指的是Meta在https://ai.meta.com/resources/models-and-libraries/llama-downloads/ 上分发的Llama 2随附的规格、手册和文档。 “被许可方”或“你”指的是你，或者你的雇主，或者任何其他人或实体（如果你代表该人或实体签订本协议），该人需达到适用法律、规则或规定要求的提供法律同意的年龄，并且如果你代表雇主或其他人员或实体签订本协议，该人需具有约束他们的合法权力。 “Llama 2”指的是基础大语言模型以及软件和算法，包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及Meta在ai.meta.com/resources/models-and-libraries/llama-downloads/ 上分发的上述内容的其他元素。 “Llama材料”指的是Meta根据本协议提供的专有Llama 2和文档（及其任何部分）。 “Meta”或“我们”指的是Meta Platforms Ireland Limited（如果你位于欧洲经济区（EEA）或瑞士，或者如果你是一个实体，你的主要营业地在欧洲经济区或瑞士）以及Meta Platforms, Inc.（如果你位于欧洲经济区或瑞士以外）。

通过点击下面的“我接受”，或者使用或分发Llama材料的任何部分或元素，你同意受本协议的约束。

许可权利和再分发
- 权利授予：你被授予在Meta体现在Llama材料中的知识产权或其他权利下的非排他性、全球性、不可转让且免版税的有限许可，以使用、复制、分发、拷贝、创建衍生作品并对Llama材料进行修改。
- 再分发和使用
  - 如果你将Llama材料或其任何衍生作品分发给第三方，你应向该第三方提供本协议的副本。
  - 如果你作为集成终端用户产品的一部分从被许可方处收到Llama材料或其任何衍生作品，则本协议第2条不适用于你。
  - 你在分发的所有Llama材料副本中，必须在作为此类副本一部分分发的“通知”文本文件中保留以下归属声明：“Llama 2根据LLAMA 2社区许可协议获得许可，版权所有 (c) Meta Platforms, Inc. 保留所有权利。”
  - 你对Llama材料的使用必须遵守适用的法律和法规（包括贸易合规法律和法规），并遵守Llama材料的可接受使用政策（可在https://ai.meta.com/llama/use-policy 上获取），该政策特此通过引用并入本协议。
  - 你不得使用Llama材料或Llama材料的任何输出或结果来改进任何其他大语言模型（不包括Llama 2或其衍生作品）。
额外的商业条款：如果在Llama 2版本发布日期，被许可方或被许可方的关联方提供的产品或服务的月活跃用户在前一个日历月超过7亿，则你必须向Meta请求许可，Meta可自行决定是否授予你许可，并且在Meta明确授予你此类权利之前，你无权行使本协议下的任何权利。
保修免责声明：除非适用法律要求，否则Llama材料及其任何输出和结果按“现状”提供，不提供任何形式的明示或暗示保证，包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。你独自负责确定使用或再分发Llama材料的适当性，并承担使用Llama材料及其任何输出和结果的相关风险。
责任限制：在任何情况下，Meta或其关联方均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害承担责任，无论责任理论是合同、侵权、疏忽、产品责任还是其他，即使Meta或其关联方已被告知此类损害的可能性。
知识产权
- 本协议未授予商标许可，并且在涉及Llama材料时，Meta和被许可方均不得使用对方或其任何关联方拥有或关联的任何名称或标记，除非在描述和再分发Llama材料时进行合理和惯常使用所需。
- 鉴于Meta对Llama材料及其衍生作品的所有权，对于你对Llama材料进行的任何衍生作品和修改，在你和Meta之间，你是并将是此类衍生作品和修改的所有者。
- 如果你对Meta或任何实体提起诉讼或其他程序（包括在诉讼中的交叉索赔或反诉），声称Llama材料或Llama 2的输出或结果，或上述任何部分构成侵犯你拥有或可许可的知识产权或其他权利，则本协议授予你的任何许可应自提起此类诉讼或索赔之日起终止。你将赔偿并使Meta免受任何第三方因你使用或分发Llama材料而产生或与之相关的索赔。
期限和终止：本协议的期限将从你接受本协议或访问Llama材料时开始，并将持续有效，直至根据本协议的条款和条件终止。如果你违反本协议的任何条款或条件，Meta可终止本协议。本协议终止后，你应删除并停止使用Llama材料。第3条、第4条和第7条在本协议终止后仍然有效。
适用法律和管辖权：本协议将受加利福尼亚州法律管辖并依其解释，不考虑法律选择原则，并且《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。

Llama 2可接受使用政策

Meta致力于促进其工具和功能（包括Llama 2）的安全和公平使用。如果你访问或使用Llama 2，你同意遵守本可接受使用政策（“政策”）。本政策的最新版本可在ai.meta.com/llama/use-policy找到。

禁止使用情况

我们希望每个人都能安全、负责地使用Llama 2。你同意你不会使用或允许他人使用Llama 2来：

违反法律或他人权利，包括：
- 从事、促进、生成、促成、鼓励、策划、煽动或助长非法或违法活动或内容，例如：
  - 暴力或恐怖主义
  - 对儿童的剥削或伤害，包括招揽、创建、获取或传播儿童剥削性内容，或未报告儿童性虐待材料
  - 人口贩运、剥削和性暴力
  - 向未成年人非法分发信息或材料，包括淫秽材料，或未对此类信息或材料采用法律要求的年龄限制
  - 性招揽
  - 任何其他犯罪活动
- 从事、促进、煽动或助长对个人或群体的骚扰、虐待、威胁或欺凌
- 从事、促进、煽动或助长在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为
- 从事未经授权或无执照的任何专业实践，包括但不限于金融、法律、医疗/健康或相关专业实践
- 在未获得适用法律要求的权利和同意的情况下，收集、处理、披露、生成或推断个人的健康、人口统计或其他敏感个人或私人信息
- 从事或促成任何侵犯、盗用或以其他方式侵犯任何第三方权利的行为或生成任何内容，包括使用Llama 2材料的任何产品或服务的输出或结果
- 创建、生成或促成恶意代码、恶意软件、计算机病毒的创建，或做任何可能禁用、使负担过重、干扰或损害网站或计算机系统的正常运行、完整性、操作或外观的事情
从事、促进、煽动、促成或协助策划或开展对个人造成死亡或身体伤害风险的活动，包括与以下方面相关的Llama 2使用：
- 军事、战争、核工业或应用、间谍活动、用于受美国国务院维护的《国际武器贸易条例》（ITAR）管制的材料或活动
- 枪支和非法武器（包括武器开发）
- 非法毒品和受管制/受控物质
- 关键基础设施、运输技术或重型机械的操作
- 自我伤害或对他人的伤害，包括自杀、自残和饮食失调
- 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容
故意欺骗或误导他人，包括与以下方面相关的Llama 2使用：
- 生成、促进或助长欺诈或虚假信息的创建或传播
- 生成、促进或助长诽谤性内容，包括创建诽谤性声明、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 声称Llama 2的使用或输出是人类生成的
- 生成或促成虚假的在线互动，包括虚假评论和其他虚假在线互动方式
未能向终端用户适当披露你的AI系统的任何已知危险

请通过以下方式之一报告任何违反本政策、软件“漏洞”或其他可能导致违反本政策的问题： - 报告模型问题：github.com/facebookresearch/llama - 报告模型生成的风险内容：developers.facebook.com/llama_output_feedback - 报告漏洞和安全问题：facebook.com/whitehat/info - 报告违反可接受使用政策或未经授权使用Llama的情况：LlamaUseReport@meta.com

门禁字段信息

属性	详情
名字	文本输入
姓氏	文本输入
出生日期	日期选择器
国家	国家选择
所属机构	文本输入
地理位置	IP定位
确认信息	通过勾选确认接受许可条款，并承认提供的信息将根据Meta隐私政策进行收集、存储、处理和共享