模型简介
模型特点
模型能力
使用案例
🚀 Llama-Guard-3-8B-IMat-GGUF
这是对meta-llama/Llama-Guard-3-8B进行Llama.cpp imatrix量化后的项目。提供了不同量化类型的文件,方便用户根据自身需求进行选择和使用。
🚀 快速开始
此项目是对 meta-llama/Llama-Guard-3-8B
模型进行量化处理后的版本。以下是详细信息:
- 原始模型:meta-llama/Llama-Guard-3-8B
- 原始数据类型:
BF16
(bfloat16
) - 量化工具:llama.cpp b3447
- IMatrix数据集:点击查看
✨ 主要特性
- 提供多种量化类型的文件,包括不同比特位的量化,如
Q8_0
、Q6_K
、Q4_K
等。 - 部分量化文件使用了 IMatrix 数据集进行优化。
- 所有文件均以 GGUF 格式提供。
📦 文件信息
IMatrix 文件
- 状态:✅ 可用
- 链接:点击查看
常用量化文件
文件名 | 量化类型 | 文件大小 | 状态 | 是否使用 IMatrix | 是否拆分 |
---|---|---|---|---|---|
Llama-Guard-3-8B.Q8_0.gguf | Q8_0 | 8.54GB | ✅ 可用 | ⚪ 静态 | 📦 否 |
Llama-Guard-3-8B.Q6_K.gguf | Q6_K | 6.60GB | ✅ 可用 | ⚪ 静态 | 📦 否 |
Llama-Guard-3-8B.Q4_K.gguf | Q4_K | 4.92GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.Q3_K.gguf | Q3_K | 4.02GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.Q2_K.gguf | Q2_K | 3.18GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
所有量化文件
文件名 | 量化类型 | 文件大小 | 状态 | 是否使用 IMatrix | 是否拆分 |
---|---|---|---|---|---|
Llama-Guard-3-8B.BF16.gguf | BF16 | 16.07GB | ✅ 可用 | ⚪ 静态 | 📦 否 |
Llama-Guard-3-8B.FP16.gguf | F16 | 16.07GB | ✅ 可用 | ⚪ 静态 | 📦 否 |
Llama-Guard-3-8B.Q8_0.gguf | Q8_0 | 8.54GB | ✅ 可用 | ⚪ 静态 | 📦 否 |
Llama-Guard-3-8B.Q6_K.gguf | Q6_K | 6.60GB | ✅ 可用 | ⚪ 静态 | 📦 否 |
Llama-Guard-3-8B.Q5_K.gguf | Q5_K | 5.73GB | ✅ 可用 | ⚪ 静态 | 📦 否 |
Llama-Guard-3-8B.Q5_K_S.gguf | Q5_K_S | 5.60GB | ✅ 可用 | ⚪ 静态 | 📦 否 |
Llama-Guard-3-8B.Q4_K.gguf | Q4_K | 4.92GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.Q4_K_S.gguf | Q4_K_S | 4.69GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.IQ4_NL.gguf | IQ4_NL | 4.68GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.IQ4_XS.gguf | IQ4_XS | 4.45GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.Q3_K.gguf | Q3_K | 4.02GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.Q3_K_L.gguf | Q3_K_L | 4.32GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.Q3_K_S.gguf | Q3_K_S | 3.66GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.IQ3_M.gguf | IQ3_M | 3.78GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.IQ3_S.gguf | IQ3_S | 3.68GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.IQ3_XS.gguf | IQ3_XS | 3.52GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.IQ3_XXS.gguf | IQ3_XXS | 3.27GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.Q2_K.gguf | Q2_K | 3.18GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
Llama-Guard-3-8B.Q2_K_S.gguf | Q2_K_S | 2.99GB | ✅ 可用 | 🟢 IMatrix | 📦 否 |
📚 详细文档
下载方式
可使用 huggingface-cli
进行下载。
推理使用
- 简单聊天模板:文档未详细提及,可根据实际需求进行探索。
- Llama.cpp:可使用该工具进行推理,具体使用方法可参考
llama.cpp
的官方文档。
🔧 技术细节
此项目基于 llama.cpp
工具对 meta-llama/Llama-Guard-3-8B
模型进行量化处理。量化过程中使用了不同的量化算法和数据集,以达到不同的量化效果。部分量化文件使用了 IMatrix 数据集进行优化,以提高模型的性能和效率。
📄 许可证
此项目遵循 llama3.1
许可证。以下是详细的许可证协议内容:
LLAMA 3.1 社区许可协议
Llama 3.1 版本发布日期:2024 年 7 月 23 日
“协议” 指本协议中规定的 Llama 材料的使用、复制、分发和修改的条款和条件。 “文档” 指 Meta 在 https://llama.meta.com/doc/overview 上分发的 Llama 3.1 随附的规范、手册和文档。 “被许可方” 或 “您” 指您,或您的雇主,或任何其他人或实体(如果您代表该人或实体签订本协议),并且您已达到适用法律、规则或法规要求的提供法律同意的年龄,并且如果您代表您的雇主或其他人员或实体签订本协议,您具有约束他们的法律权力。 “Llama 3.1” 指 Meta 在 https://llama.meta.com/llama-downloads 上分发的基础大语言模型以及软件和算法,包括机器学习模型代码、训练后的模型权重、推理启用代码、训练启用代码、微调启用代码以及上述内容的其他元素。 “Llama 材料” 指 Meta 根据本协议提供的专有 Llama 3.1 和文档(及其任何部分)的统称。 “Meta” 或 “我们” 指 Meta Platforms Ireland Limited(如果您位于欧洲经济区或瑞士,或者如果您是一个实体,您的主要营业地位于欧洲经济区或瑞士)和 Meta Platforms, Inc.(如果您位于欧洲经济区或瑞士以外)。
- 许可权利和再分发
- 权利授予:您被授予在 Meta 体现在 Llama 材料中的知识产权或其他权利下的非排他性、全球性、不可转让且免版税的有限许可,以使用、复制、分发、复制、创作衍生作品并对 Llama 材料进行修改。
- 再分发和使用
- 如果您分发或提供 Llama 材料(或其任何衍生作品),或包含其中任何内容的产品或服务(包括另一个 AI 模型),您应 (A) 随任何此类 Llama 材料提供本协议的副本;并且 (B) 在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示 “Built with Llama”。如果您使用 Llama 材料或 Llama 材料的任何输出或结果来创建、训练、微调或以其他方式改进一个 AI 模型,并将其分发或提供,您还应在任何此类 AI 模型名称的开头包含 “Llama”。
- 如果您作为集成最终用户产品的一部分从被许可方处接收 Llama 材料或其任何衍生作品,则本协议第 2 条不适用于您。
- 您必须在您分发的所有 Llama 材料副本中保留以下归属声明,该声明应包含在作为此类副本一部分分发的 “Notice” 文本文件中:“Llama 3.1 依据 Llama 3.1 社区许可进行许可,版权所有 © Meta Platforms, Inc. 保留所有权利。”
- 您对 Llama 材料的使用必须遵守适用的法律和法规(包括贸易合规法律法规),并遵守 Llama 材料的可接受使用政策(可在 https://llama.meta.com/llama3_1/use-policy 上获取),该政策特此通过引用并入本协议。
- 额外商业条款:如果在 Llama 3.1 版本发布日期,被许可方或其关联公司提供的产品或服务在前一个日历月的月活跃用户超过 7 亿,则您必须向 Meta 请求许可,Meta 可自行决定是否授予您许可,并且在 Meta 明确授予您此类权利之前,您无权行使本协议下的任何权利。
- 保修免责声明:除非适用法律要求,否则 Llama 材料及其任何输出和结果均按 “原样” 提供,不提供任何形式的保证,并且 Meta 否认所有明示和暗示的保证,包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您独自负责确定使用或再分发 Llama 材料的适当性,并承担与您使用 Llama 材料及其任何输出和结果相关的任何风险。
- 责任限制:在任何情况下,Meta 或其关联公司均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害承担责任,无论责任理论如何,包括合同、侵权、疏忽、产品责任或其他方面,即使 Meta 或其关联公司已被告知任何此类损害的可能性。
- 知识产权
- 本协议未授予商标许可,并且与 Llama 材料相关,除非本协议第 5(a) 条规定或为描述和再分发 Llama 材料的合理和惯常使用所必需,否则 Meta 和被许可方均不得使用对方或其任何关联公司拥有或关联的任何名称或标记。Meta 特此授予您仅为遵守第 1.b.i 条最后一句的要求而使用 “Llama”(“标记”)的许可。您将遵守 Meta 的品牌指南(目前可在 https://about.meta.com/brand/resources/meta/company-brand/ 上获取)。因您使用该标记而产生的所有商誉均归 Meta 所有。
- 鉴于 Meta 对 Llama 材料及其为 Meta 制作的衍生作品的所有权,就您制作的 Llama 材料的任何衍生作品和修改而言,在您和 Meta 之间,您是并将是此类衍生作品和修改的所有者。
- 如果您对 Meta 或任何实体提起诉讼或其他程序(包括在诉讼中的交叉索赔或反诉),声称 Llama 材料或 Llama 3.1 的输出或结果,或上述任何内容的任何部分,构成侵犯您拥有或可许可的知识产权或其他权利,则本协议授予您的任何许可应自此类诉讼或索赔提起之日起终止。您将赔偿并使 Meta 免受任何第三方因您使用或分发 Llama 材料而产生或与之相关的任何索赔。
- 期限和终止:本协议的期限自您接受本协议或访问 Llama 材料之日起开始,并将持续有效,直至根据本协议的条款和条件终止。如果您违反本协议的任何条款或条件,Meta 可终止本协议。本协议终止后,您应删除并停止使用 Llama 材料。第 3、4 和 7 条在本协议终止后仍然有效。
- 适用法律和管辖权:本协议受加利福尼亚州法律管辖并依其解释,不考虑法律选择原则,并且《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。
Llama 3.1 可接受使用政策
Meta 致力于促进其工具和功能(包括 Llama 3.1)的安全和公平使用。如果您访问或使用 Llama 3.1,您同意本可接受使用政策(“政策”)。本政策的最新副本可在 https://llama.meta.com/llama3_1/use-policy 上找到。
禁止使用情况
我们希望每个人都能安全、负责任地使用 Llama 3.1。您同意您不会使用或允许他人使用 Llama 3.1 来:
- 违反法律或他人权利,包括:
- 从事、促进、生成、促成、鼓励、计划、煽动或进一步进行非法或违法活动或内容,例如:
- 暴力或恐怖主义
- 对儿童的剥削或伤害,包括招揽、创建、获取或传播儿童剥削性内容或未能报告儿童性虐待材料
- 人口贩运、剥削和性暴力
- 向未成年人非法分发信息或材料,包括淫秽材料,或未能对此类信息或材料采用法律要求的年龄限制
- 性招揽
- 任何其他犯罪活动
- 从事、促进、煽动或促成对个人或群体的骚扰、虐待、威胁或欺凌
- 从事、促进、煽动或促成在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为
- 从事未经授权或无执照的任何专业实践,包括但不限于金融、法律、医学/健康或相关专业实践
- 收集、处理、披露、生成或推断个人的健康、人口统计或其他敏感个人或私人信息,而未获得适用法律要求的权利和同意
- 从事或促成任何侵犯、盗用或以其他方式侵犯任何第三方权利的行为或生成任何内容,包括使用 Llama 材料的任何产品或服务的输出或结果
- 创建、生成或促成创建恶意代码、恶意软件、计算机病毒或做任何其他可能禁用、使负担过重、干扰或损害网站或计算机系统的正常工作、完整性、操作或外观的事情
- 从事、促进、生成、促成、鼓励、计划、煽动或进一步进行非法或违法活动或内容,例如:
- 从事、促进、煽动、促成或协助计划或开展对个人造成死亡或身体伤害风险的活动,包括与以下方面相关的 Llama 3.1 的使用:
- 军事、战争、核工业或应用、间谍活动、用于受美国国务院维护的《国际武器贸易条例》(ITAR)约束的材料或活动
- 枪支和非法武器(包括武器开发)
- 非法药物和受管制/受控物质
- 关键基础设施、运输技术或重型机械的操作
- 自我伤害或伤害他人,包括自杀、自残和饮食失调
- 任何旨在煽动或促进对个人的暴力、虐待或任何身体伤害的内容
- 故意欺骗或误导他人,包括与以下方面相关的 Llama 3.1 的使用:
- 生成、促进或进一步进行欺诈或创建或促进虚假信息
- 生成、促进或进一步进行诽谤性内容,包括创建诽谤性声明、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 表示 Llama 3.1 的使用或输出是人类生成的
- 生成或促成虚假的在线互动,包括虚假评论和其他虚假在线互动方式
- 未能向最终用户适当披露您的 AI 系统的任何已知危险
请通过以下方式之一报告本政策的任何违反情况、软件 “漏洞” 或其他可能导致违反本政策的问题:
- 报告模型问题:https://github.com/meta-llama/llama-models/issues
- 报告模型生成的风险内容:developers.facebook.com/llama_output_feedback
- 报告漏洞和安全问题:facebook.com/whitehat/info
- 报告违反可接受使用政策或未经授权使用 Meta Llama 3 的情况:LlamaUseReport@meta.com
❓ 常见问题解答
为什么 IMatrix 没有应用到所有地方?
文档未详细提及,可能与量化算法和模型性能有关。
如何合并拆分的 GGUF 文件?
文档未详细提及,可参考 llama.cpp
的官方文档或相关社区资源。



