bagel-8b-v1.0-GGUF开源模型 - 多种量化文件适配不同硬件性能需求

首页

Bagel 8b V1.0 GGUF

由 bartowski 开发

bagel-8b-v1.0的Llamacpp imatrix量化版本，提供多种量化文件以满足不同硬件和性能需求。

大型语言模型开源协议:其他 #多量化选择 #高性能优化 #Llama3架构

下载量 13.12k

发布时间 : 5/11/2024

模型简介

基于Meta-Llama-3-8B的量化版本，适用于文本生成任务，提供从高质量到低质量的多种量化选择。

模型特点

多种量化选择

提供从高质量（Q8_0）到低质量（IQ1_S）的多种量化文件，适应不同硬件和性能需求。

性能优化

部分量化文件采用新方法，在保证性能的同时节省空间。

广泛训练数据

基于多个高质量数据集训练，涵盖多种领域和任务。

模型能力

文本生成

多轮对话

指令跟随

使用案例

通用对话

智能助手

可用于构建智能对话助手，回答用户问题或提供建议。

内容生成

文本创作

可用于生成文章、故事或其他创意文本内容。

🚀 bagel-8b-v1.0的Llamacpp imatrix量化版本

本项目是bagel-8b-v1.0的Llamacpp imatrix量化版本，提供了多种量化文件供用户选择，以满足不同的硬件和性能需求。

🚀 快速开始

安装huggingface-cli

首先，确保你已经安装了huggingface-cli：

pip install -U "huggingface_hub[cli]"

下载指定文件

你可以指定要下载的具体文件：

huggingface-cli download bartowski/bagel-8b-v1.0-GGUF --include "bagel-8b-v1.0-Q4_K_M.gguf" --local-dir ./ --local-dir-use-symlinks False

下载大模型拆分文件

如果模型大小超过50GB，它会被拆分为多个文件。若要将它们全部下载到本地文件夹，可运行以下命令：

huggingface-cli download bartowski/bagel-8b-v1.0-GGUF --include "bagel-8b-v1.0-Q8_0.gguf/*" --local-dir bagel-8b-v1.0-Q8_0 --local-dir-use-symlinks False

你可以指定一个新的本地目录（如bagel-8b-v1.0-Q8_0），也可以将它们全部下载到当前目录（./）。

✨ 主要特性

多种量化选择：提供了从高质量到低质量的多种量化文件，以适应不同的硬件和性能需求。
性能优化：部分量化文件采用了新的方法，在保证一定性能的同时节省了空间。

📦 安装指南

安装huggingface-cli：

pip install -U "huggingface_hub[cli]"

💻 使用示例

下载指定文件示例

huggingface-cli download bartowski/bagel-8b-v1.0-GGUF --include "bagel-8b-v1.0-Q4_K_M.gguf" --local-dir ./ --local-dir-use-symlinks False

下载大模型拆分文件示例

huggingface-cli download bartowski/bagel-8b-v1.0-GGUF --include "bagel-8b-v1.0-Q8_0.gguf/*" --local-dir bagel-8b-v1.0-Q8_0 --local-dir-use-symlinks False

📚 详细文档

基础信息

属性	详情
基础模型	meta-llama/Meta-Llama-3-8B
量化者	bartowski
任务类型	文本生成
许可证	llama3，查看许可证

训练数据集

ai2_arc
allenai/ultrafeedback_binarized_cleaned
argilla/distilabel-intel-orca-dpo-pairs
jondurbin/airoboros-3.2
codeparrot/apps
facebook/belebele
bluemoon-fandom-1-1-rp-cleaned
boolq
camel-ai/biology
camel-ai/chemistry
camel-ai/math
camel-ai/physics
jondurbin/contextual-dpo-v0.1
jondurbin/gutenberg-dpo-v0.1
jondurbin/py-dpo-v0.1
jondurbin/truthy-dpo-v0.1
LDJnr/Capybara
jondurbin/cinematika-v0.1
WizardLM/WizardLM_evol_instruct_70k
glaiveai/glaive-function-calling-v2
jondurbin/gutenberg-dpo-v0.1
grimulkan/LimaRP-augmented
lmsys/lmsys-chat-1m
ParisNeo/lollms_aware_dataset
TIGER-Lab/MathInstruct
Muennighoff/natural-instructions
openbookqa
kingbri/PIPPA-shareGPT
piqa
Vezora/Tested-22k-Python-Alpaca
ropes
cakiki/rosetta-code
Open-Orca/SlimOrca
b-mc2/sql-create-context
squad_v2
mattpscott/airoboros-summarization
migtissera/Synthia-v1.3
unalignment/toxic-dpo-v0.2
WhiteRabbitNeo/WRN-Chapter-1
WhiteRabbitNeo/WRN-Chapter-2
winogrande

提示格式

<|begin_of_text|><|start_header_id|>system<|end_header_id|>

{system_prompt}<|eot_id|><|start_header_id|>user<|end_header_id|>

{prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>

下载文件列表

文件名	量化类型	文件大小	描述
bagel-8b-v1.0-Q8_0.gguf	Q8_0	8.54GB	极高质量，通常不需要，但为最大可用量化。
bagel-8b-v1.0-Q6_K.gguf	Q6_K	6.59GB	非常高的质量，接近完美，推荐。
bagel-8b-v1.0-Q5_K_M.gguf	Q5_K_M	5.73GB	高质量，推荐。
bagel-8b-v1.0-Q5_K_S.gguf	Q5_K_S	5.59GB	高质量，推荐。
bagel-8b-v1.0-Q4_K_M.gguf	Q4_K_M	4.92GB	良好质量，每个权重约使用4.83位，推荐。
bagel-8b-v1.0-Q4_K_S.gguf	Q4_K_S	4.69GB	质量稍低，但节省更多空间，推荐。
bagel-8b-v1.0-IQ4_NL.gguf	IQ4_NL	4.67GB	质量尚可，比Q4_K_S稍小，性能相似，推荐。
bagel-8b-v1.0-IQ4_XS.gguf	IQ4_XS	4.44GB	质量尚可，比Q4_K_S小，性能相似，推荐。
bagel-8b-v1.0-Q3_K_L.gguf	Q3_K_L	4.32GB	质量较低但可用，适合低内存情况。
bagel-8b-v1.0-Q3_K_M.gguf	Q3_K_M	4.01GB	质量更低。
bagel-8b-v1.0-IQ3_M.gguf	IQ3_M	3.78GB	中低质量，新方法，性能与Q3_K_M相当。
bagel-8b-v1.0-IQ3_S.gguf	IQ3_S	3.68GB	质量较低，新方法，性能不错，推荐使用，比Q3_K_S同大小下性能更好。
bagel-8b-v1.0-Q3_K_S.gguf	Q3_K_S	3.66GB	低质量，不推荐。
bagel-8b-v1.0-IQ3_XS.gguf	IQ3_XS	3.51GB	质量较低，新方法，性能不错，比Q3_K_S稍好。
bagel-8b-v1.0-IQ3_XXS.gguf	IQ3_XXS	3.27GB	质量较低，新方法，性能与Q3量化相当。
bagel-8b-v1.0-Q2_K.gguf	Q2_K	3.17GB	极低质量，但出人意料地可用。
bagel-8b-v1.0-IQ2_M.gguf	IQ2_M	2.94GB	极低质量，使用了最先进的技术，出人意料地可用。
bagel-8b-v1.0-IQ2_S.gguf	IQ2_S	2.75GB	极低质量，使用了最先进的技术，可用。
bagel-8b-v1.0-IQ2_XS.gguf	IQ2_XS	2.60GB	极低质量，使用了最先进的技术，可用。
bagel-8b-v1.0-IQ2_XXS.gguf	IQ2_XXS	2.39GB	质量较低，使用了最先进的技术，可用。
bagel-8b-v1.0-IQ1_M.gguf	IQ1_M	2.16GB	极低质量，不推荐。
bagel-8b-v1.0-IQ1_S.gguf	IQ1_S	2.01GB	极低质量，不推荐。