模型简介
模型特点
模型能力
使用案例
🚀 Meta-Llama-3.1-8B的Llamacpp量化版本
本项目使用 llama.cpp 的 b3472 版本进行量化处理。旨在为Meta-Llama-3.1-8B模型提供不同量化类型的版本,以满足不同场景下对模型大小和性能的需求。
🚀 快速开始
下载文件
你可以从以下列表中选择下载单个文件(而非整个分支):
文件名 | 量化类型 | 文件大小 | 困惑度 (wikitext-2-raw-v1.test) |
---|---|---|---|
Meta-Llama-3.1-8B-BF16.gguf | BF16 | 16.10GB | 6.4006 +/- 0.03938 |
Meta-Llama-3.1-8B-FP16.gguf | FP16 | 16.10GB | 6.4016 +/- 0.03939 |
Meta-Llama-3.1-8B-Q8_0.gguf | Q8_0 | 8.54GB | 6.4070 +/- 0.03941 |
Meta-Llama-3.1-8B-Q6_K.gguf | Q6_K | 6.60GB | 6.4231 +/- 0.03957 |
Meta-Llama-3.1-8B-Q5_K_M.gguf | Q5_K_M | 5.73GB | 6.4623 +/- 0.03987 |
Meta-Llama-3.1-8B-Q5_K_S.gguf | Q5_K_S | 5.60GB | 6.5161 +/- 0.04028 |
Meta-Llama-3.1-8B-Q4_K_M.gguf | Q4_K_M | 4.92GB | 6.5837 +/- 0.04068 |
Meta-Llama-3.1-8B-Q4_K_S.gguf | Q4_K_S | 4.69GB | 6.6751 +/- 0.04125 |
Meta-Llama-3.1-8B-Q3_K_L.gguf | Q3_K_L | 4.32GB | 6.9458 +/- 0.04329 |
Meta-Llama-3.1-8B-Q3_K_M.gguf | Q3_K_M | 4.02GB | 7.0488 +/- 0.04384 |
Meta-Llama-3.1-8B-Q3_K_S.gguf | Q3_K_S | 3.66GB | 7.8823 +/- 0.04920 |
Meta-Llama-3.1-8B-Q2_K.gguf | Q2_K | 3.18GB | 9.7262 +/- 0.06393 |
基准测试结果
基准测试结果使用以下数据集计算得出:
基准测试 | 量化类型 | 指标 |
---|---|---|
WinoGrande (0-shot) | Q8_0 | 74.1121 +/- 1.2311 |
WinoGrande (0-shot) | Q4_K_M | 73.1650 +/- 1.2453 |
WinoGrande (0-shot) | Q3_K_M | 72.7703 +/- 1.2511 |
WinoGrande (0-shot) | Q3_K_S | 72.3757 +/- 1.2567 |
WinoGrande (0-shot) | Q2_K | 68.4294 +/- 1.3063 |
HellaSwag (0-shot) | Q8_0 | 79.41645091 |
HellaSwag (0-shot) | Q4_K_M | 79.05795658 |
HellaSwag (0-shot) | Q3_K_M | 79.41645091 |
HellaSwag (0-shot) | Q3_K_S | 76.93686517 |
HellaSwag (0-shot) | Q2_K | 72.16689902 |
MMLU (0-shot) | Q8_0 | 39.4703 +/- 1.2427 |
MMLU (0-shot) | Q4_K_M | 39.5349 +/- 1.2431 |
MMLU (0-shot) | Q3_K_M | 38.8889 +/- 1.2394 |
MMLU (0-shot) | Q3_K_S | 37.2739 +/- 1.2294 |
MMLU (0-shot) | Q2_K | 35.4651 +/- 1.2163 |
使用huggingface-cli下载
首先,确保你已经安装了huggingface-cli:
pip install -U "huggingface_hub[cli]"
然后,你可以指定要下载的具体文件:
huggingface-cli download fedric95/Meta-Llama-3.1-8B-GGUF --include "Meta-Llama-3.1-8B-Q4_K_M.gguf" --local-dir ./
如果模型大小超过50GB,它会被拆分为多个文件。若要将它们全部下载到本地文件夹,请运行:
huggingface-cli download fedric95/Meta-Llama-3.1-8B-GGUF --include "Meta-Llama-3.1-8B-Q8_0.gguf/*" --local-dir Meta-Llama-3.1-8B-Q8_0
你可以指定一个新的本地目录(如 Meta-Llama-3.1-8B-Q8_0
),也可以将它们全部下载到当前目录(./
)。
可复现性
有关可复现性的更多信息,请参考:https://github.com/ggerganov/llama.cpp/issues/8650#issuecomment-2261497976
📄 许可证
LLAMA 3.1社区许可协议
Llama 3.1版本发布日期:2024年7月23日
“协议”指本协议中规定的使用、复制、分发和修改Llama材料的条款和条件。 “文档”指Meta在https://llama.meta.com/doc/overview 分发的Llama 3.1随附的规范、手册和文档。 “被许可方”或“您”指您,或您的雇主,或任何其他个人或实体(如果您代表该个人或实体签订本协议),且该个人或实体已达到适用法律、规则或法规要求的提供法律同意的年龄,并且如果您代表其签订本协议,具有约束您的雇主或该其他个人或实体的合法权力。 “Llama 3.1”指Meta在https://llama.meta.com/llama-downloads 分发的基础大语言模型、软件和算法,包括机器学习模型代码、训练好的模型权重、推理启用代码、训练启用代码、微调启用代码以及上述内容的其他元素。 “Llama材料”指根据本协议提供的Meta专有的Llama 3.1和文档(及其任何部分)的统称。 “Meta”或“我们”指Meta Platforms Ireland Limited(如果您位于欧洲经济区或瑞士,或者如果您是一个实体,您的主要营业地位于欧洲经济区或瑞士)和Meta Platforms, Inc.(如果您位于欧洲经济区或瑞士以外)。
1. 许可权利和再分发
a. 权利授予。您被授予在Llama材料中体现的Meta知识产权或Meta拥有的其他权利下的非排他性、全球性、不可转让且免版税的有限许可,以使用、复制、分发、拷贝、创作衍生作品并对Llama材料进行修改。 b. 再分发和使用。 i. 如果您分发或提供Llama材料(或其任何衍生作品),或包含其中任何内容的产品或服务(包括另一个AI模型),您应(A)随任何此类Llama材料提供本协议的副本;并且(B)在相关网站、用户界面、博客文章、关于页面或产品文档上显著显示“Built with Llama”。如果您使用Llama材料或Llama材料的任何输出或结果来创建、训练、微调或以其他方式改进一个AI模型,并进行分发或提供,您还应在任何此类AI模型名称的开头包含“Llama”。 ii. 如果您作为集成最终用户产品的一部分从被许可方处接收Llama材料或其任何衍生作品,则本协议第2条不适用于您。 iii. 您必须在您分发的所有Llama材料副本中,在作为此类副本一部分分发的“Notice”文本文件中保留以下归属声明:“Llama 3.1 is licensed under the Llama 3.1 Community License, Copyright © Meta Platforms, Inc. All Rights Reserved.” iv. 您对Llama材料的使用必须遵守适用的法律法规(包括贸易合规法律法规),并遵守Llama材料的可接受使用政策(可在https://llama.meta.com/llama3_1/use-policy 找到),该政策特此通过引用并入本协议。
2. 额外商业条款
如果在Llama 3.1版本发布日期,被许可方或被许可方关联方提供的产品或服务的月活跃用户在前一个日历月超过7亿月活跃用户,您必须向Meta请求许可,Meta可自行决定是否授予您许可,并且在Meta明确授予您此类权利之前,您无权行使本协议下的任何权利。
3. 保修免责声明
除非适用法律要求,Llama材料及其任何输出和结果按“现状”提供,不提供任何形式的保证,Meta否认所有形式的明示和暗示保证,包括但不限于所有权、不侵权、适销性或特定用途适用性的保证。您独自负责确定使用或再分发Llama材料的适当性,并承担与您使用Llama材料及其任何输出和结果相关的任何风险。
4. 责任限制
在任何责任理论下,无论是合同、侵权、疏忽、产品责任还是其他,Meta或其关联方均不对因本协议引起的任何利润损失或任何间接、特殊、后果性、偶发性、惩戒性或惩罚性损害承担责任,即使Meta或其关联方已被告知此类损害的可能性。
5. 知识产权
a. 本协议未授予商标许可,并且与Llama材料相关,除非在描述和再分发Llama材料时进行合理和惯常使用所需,或如本节5(a)所述,Meta和被许可方均不得使用对方或其任何关联方拥有或关联的任何名称或标记。Meta特此授予您仅为遵守第1.b.i条最后一句所需使用“Llama”(“标记”)的许可。您将遵守Meta的品牌指南(目前可在https://about.meta.com/brand/resources/meta/company-brand/ 访问)。因您使用标记而产生的所有商誉将归属于Meta。 b. 鉴于Meta对Llama材料及其为Meta制作的衍生作品的所有权,就您制作的Llama材料的任何衍生作品和修改而言,在您和Meta之间,您是且将是此类衍生作品和修改的所有者。 c. 如果您对Meta或任何实体提起诉讼或其他程序(包括在诉讼中的交叉索赔或反诉),声称Llama材料或Llama 3.1的输出或结果,或上述任何内容的任何部分,构成对您拥有或可许可的知识产权或其他权利的侵权,则本协议授予您的任何许可应自此类诉讼或索赔提起之日起终止。您将赔偿并使Meta免受任何第三方因您使用或分发Llama材料而产生或与之相关的索赔。
6. 期限和终止
本协议的期限自您接受本协议或访问Llama材料时开始,并将持续有效,直至根据本协议的条款和条件终止。如果您违反本协议的任何条款或条件,Meta可终止本协议。本协议终止后,您应删除并停止使用Llama材料。第3、4和7条在本协议终止后仍然有效。
7. 适用法律和管辖权
本协议将受加利福尼亚州法律管辖并依其解释,不考虑法律选择原则,并且《联合国国际货物销售合同公约》不适用于本协议。加利福尼亚州的法院对因本协议引起的任何争议具有专属管辖权。
Llama 3.1可接受使用政策
Meta致力于促进其工具和功能(包括Llama 3.1)的安全和公平使用。如果您访问或使用Llama 3.1,您同意本可接受使用政策(“政策”)。本政策的最新版本可在https://llama.meta.com/llama3_1/use-policy 找到。
禁止使用
我们希望每个人都能安全、负责任地使用Llama 3.1。您同意您不会使用或允许他人使用Llama 3.1来:
- 违反法律或他人权利,包括:
- 从事、促进、生成、促成、鼓励、策划、煽动或进一步推动非法或违法活动或内容,例如:
- 暴力或恐怖主义
- 对儿童的剥削或伤害,包括招揽、创建、获取或传播儿童剥削内容或未能报告儿童性虐待材料
- 人口贩运、剥削和性暴力
- 向未成年人非法分发信息或材料,包括淫秽材料,或未能对此类信息或材料采用法律要求的年龄限制
- 性招揽
- 任何其他犯罪活动
- 从事、促进、煽动或便利对个人或群体的骚扰、虐待、威胁或欺凌
- 从事、促进、煽动或便利在就业、就业福利、信贷、住房、其他经济福利或其他基本商品和服务的提供方面的歧视或其他非法或有害行为
- 从事未经授权或无执照的任何专业实践,包括但不限于金融、法律、医疗/健康或相关专业实践
- 在未获得适用法律要求的权利和同意的情况下,收集、处理、披露、生成或推断个人的健康、人口统计或其他敏感个人或私人信息
- 从事或便利任何侵犯、挪用或以其他方式侵犯任何第三方权利的行为或生成任何内容,包括使用Llama材料的任何产品或服务的输出或结果
- 创建、生成或便利创建恶意代码、恶意软件、计算机病毒或做任何其他可能禁用、使负担过重、干扰或损害网站或计算机系统的正常工作、完整性、操作或外观的事情
- 从事、促进、生成、促成、鼓励、策划、煽动或进一步推动非法或违法活动或内容,例如:
- 从事、促进、煽动、便利或协助策划或开展对个人造成死亡或身体伤害风险的活动,包括与以下方面相关的Llama 3.1的使用:
- 军事、战争、核工业或应用、间谍活动、用于受美国国务院维护的《国际武器贸易条例》(ITAR)管制的材料或活动
- 枪支和非法武器(包括武器开发)
- 非法药物和受管制/受控物质
- 关键基础设施、运输技术或重型机械的操作
- 自我伤害或伤害他人,包括自杀、自残和饮食失调
- 任何旨在煽动或促进暴力、虐待或对个人造成身体伤害的内容
- 故意欺骗或误导他人,包括与以下方面相关的Llama 3.1的使用:
- 生成、促进或进一步推动欺诈或虚假信息的创建或传播
- 生成、促进或进一步推动诽谤性内容,包括创建诽谤性声明、图像或其他内容
- 生成、促进或进一步分发垃圾邮件
- 在未经同意、授权或合法权利的情况下冒充他人
- 表示Llama 3.1的使用或输出是人类生成的
- 生成或便利虚假的在线互动,包括虚假评论和其他虚假在线互动方式
- 未能向最终用户适当披露您的AI系统的任何已知危险
请通过以下方式之一报告本政策的任何违反行为、软件“漏洞”或其他可能导致违反本政策的问题:
- 报告模型问题:https://github.com/meta-llama/llama-models/issues
- 报告模型生成的风险内容:developers.facebook.com/llama_output_feedback
- 报告漏洞和安全问题:facebook.com/whitehat/info
- 报告可接受使用政策的违反行为或未经授权使用Meta Llama 3的情况:LlamaUseReport@meta.com
额外信息
属性 | 详情 |
---|---|
基础模型 | meta-llama/Meta-Llama-3.1-8B |
支持语言 | 英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语、泰语 |
许可证 | llama3.1 |
任务类型 | 文本生成 |
标签 | facebook、meta、pytorch、llama、llama-3 |
量化者 | fedric95 |
在使用本项目时,请确保您已仔细阅读并同意上述许可证协议和可接受使用政策。如有任何疑问,请随时联系我们。



