bagel-8b-v1.0-GGUF開源模型 - 多種量化文件適配不同硬件性能需求

首頁

Bagel 8b V1.0 GGUF

由bartowski開發

bagel-8b-v1.0的Llamacpp imatrix量化版本，提供多種量化文件以滿足不同硬件和性能需求。

大型語言模型開源協議:其他 #多量化選擇 #高性能優化 #Llama3架構

下載量 13.12k

發布時間 : 5/11/2024

模型概述

基於Meta-Llama-3-8B的量化版本，適用於文本生成任務，提供從高質量到低質量的多種量化選擇。

模型特點

多種量化選擇

提供從高質量（Q8_0）到低質量（IQ1_S）的多種量化文件，適應不同硬件和性能需求。

性能優化

部分量化文件採用新方法，在保證性能的同時節省空間。

廣泛訓練數據

基於多個高質量數據集訓練，涵蓋多種領域和任務。

模型能力

文本生成

多輪對話

指令跟隨

使用案例

通用對話

智能助手

可用於構建智能對話助手，回答用戶問題或提供建議。

內容生成

文本創作

可用於生成文章、故事或其他創意文本內容。

🚀 bagel-8b-v1.0的Llamacpp imatrix量化版本

本項目是bagel-8b-v1.0的Llamacpp imatrix量化版本，提供了多種量化文件供用戶選擇，以滿足不同的硬件和性能需求。

🚀 快速開始

安裝huggingface-cli

首先，確保你已經安裝了huggingface-cli：

pip install -U "huggingface_hub[cli]"

下載指定文件

你可以指定要下載的具體文件：

huggingface-cli download bartowski/bagel-8b-v1.0-GGUF --include "bagel-8b-v1.0-Q4_K_M.gguf" --local-dir ./ --local-dir-use-symlinks False

下載大模型拆分文件

如果模型大小超過50GB，它會被拆分為多個文件。若要將它們全部下載到本地文件夾，可運行以下命令：

huggingface-cli download bartowski/bagel-8b-v1.0-GGUF --include "bagel-8b-v1.0-Q8_0.gguf/*" --local-dir bagel-8b-v1.0-Q8_0 --local-dir-use-symlinks False

你可以指定一個新的本地目錄（如bagel-8b-v1.0-Q8_0），也可以將它們全部下載到當前目錄（./）。

✨ 主要特性

多種量化選擇：提供了從高質量到低質量的多種量化文件，以適應不同的硬件和性能需求。
性能優化：部分量化文件採用了新的方法，在保證一定性能的同時節省了空間。

📦 安裝指南

安裝huggingface-cli：

pip install -U "huggingface_hub[cli]"

💻 使用示例

下載指定文件示例

huggingface-cli download bartowski/bagel-8b-v1.0-GGUF --include "bagel-8b-v1.0-Q4_K_M.gguf" --local-dir ./ --local-dir-use-symlinks False

下載大模型拆分文件示例

huggingface-cli download bartowski/bagel-8b-v1.0-GGUF --include "bagel-8b-v1.0-Q8_0.gguf/*" --local-dir bagel-8b-v1.0-Q8_0 --local-dir-use-symlinks False

📚 詳細文檔

基礎信息

屬性	詳情
基礎模型	meta-llama/Meta-Llama-3-8B
量化者	bartowski
任務類型	文本生成
許可證	llama3，查看許可證

訓練數據集

ai2_arc
allenai/ultrafeedback_binarized_cleaned
argilla/distilabel-intel-orca-dpo-pairs
jondurbin/airoboros-3.2
codeparrot/apps
facebook/belebele
bluemoon-fandom-1-1-rp-cleaned
boolq
camel-ai/biology
camel-ai/chemistry
camel-ai/math
camel-ai/physics
jondurbin/contextual-dpo-v0.1
jondurbin/gutenberg-dpo-v0.1
jondurbin/py-dpo-v0.1
jondurbin/truthy-dpo-v0.1
LDJnr/Capybara
jondurbin/cinematika-v0.1
WizardLM/WizardLM_evol_instruct_70k
glaiveai/glaive-function-calling-v2
jondurbin/gutenberg-dpo-v0.1
grimulkan/LimaRP-augmented
lmsys/lmsys-chat-1m
ParisNeo/lollms_aware_dataset
TIGER-Lab/MathInstruct
Muennighoff/natural-instructions
openbookqa
kingbri/PIPPA-shareGPT
piqa
Vezora/Tested-22k-Python-Alpaca
ropes
cakiki/rosetta-code
Open-Orca/SlimOrca
b-mc2/sql-create-context
squad_v2
mattpscott/airoboros-summarization
migtissera/Synthia-v1.3
unalignment/toxic-dpo-v0.2
WhiteRabbitNeo/WRN-Chapter-1
WhiteRabbitNeo/WRN-Chapter-2
winogrande

提示格式

<|begin_of_text|><|start_header_id|>system<|end_header_id|>

{system_prompt}<|eot_id|><|start_header_id|>user<|end_header_id|>

{prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>

下載文件列表

文件名	量化類型	文件大小	描述
bagel-8b-v1.0-Q8_0.gguf	Q8_0	8.54GB	極高質量，通常不需要，但為最大可用量化。
bagel-8b-v1.0-Q6_K.gguf	Q6_K	6.59GB	非常高的質量，接近完美，推薦。
bagel-8b-v1.0-Q5_K_M.gguf	Q5_K_M	5.73GB	高質量，推薦。
bagel-8b-v1.0-Q5_K_S.gguf	Q5_K_S	5.59GB	高質量，推薦。
bagel-8b-v1.0-Q4_K_M.gguf	Q4_K_M	4.92GB	良好質量，每個權重約使用4.83位，推薦。
bagel-8b-v1.0-Q4_K_S.gguf	Q4_K_S	4.69GB	質量稍低，但節省更多空間，推薦。
bagel-8b-v1.0-IQ4_NL.gguf	IQ4_NL	4.67GB	質量尚可，比Q4_K_S稍小，性能相似，推薦。
bagel-8b-v1.0-IQ4_XS.gguf	IQ4_XS	4.44GB	質量尚可，比Q4_K_S小，性能相似，推薦。
bagel-8b-v1.0-Q3_K_L.gguf	Q3_K_L	4.32GB	質量較低但可用，適合低內存情況。
bagel-8b-v1.0-Q3_K_M.gguf	Q3_K_M	4.01GB	質量更低。
bagel-8b-v1.0-IQ3_M.gguf	IQ3_M	3.78GB	中低質量，新方法，性能與Q3_K_M相當。
bagel-8b-v1.0-IQ3_S.gguf	IQ3_S	3.68GB	質量較低，新方法，性能不錯，推薦使用，比Q3_K_S同大小下性能更好。
bagel-8b-v1.0-Q3_K_S.gguf	Q3_K_S	3.66GB	低質量，不推薦。
bagel-8b-v1.0-IQ3_XS.gguf	IQ3_XS	3.51GB	質量較低，新方法，性能不錯，比Q3_K_S稍好。
bagel-8b-v1.0-IQ3_XXS.gguf	IQ3_XXS	3.27GB	質量較低，新方法，性能與Q3量化相當。
bagel-8b-v1.0-Q2_K.gguf	Q2_K	3.17GB	極低質量，但出人意料地可用。
bagel-8b-v1.0-IQ2_M.gguf	IQ2_M	2.94GB	極低質量，使用了最先進的技術，出人意料地可用。
bagel-8b-v1.0-IQ2_S.gguf	IQ2_S	2.75GB	極低質量，使用了最先進的技術，可用。
bagel-8b-v1.0-IQ2_XS.gguf	IQ2_XS	2.60GB	極低質量，使用了最先進的技術，可用。
bagel-8b-v1.0-IQ2_XXS.gguf	IQ2_XXS	2.39GB	質量較低，使用了最先進的技術，可用。
bagel-8b-v1.0-IQ1_M.gguf	IQ1_M	2.16GB	極低質量，不推薦。
bagel-8b-v1.0-IQ1_S.gguf	IQ1_S	2.01GB	極低質量，不推薦。