免費部署！nvidia_AceInstruct-7B-GGUF模型，適用代碼、數學等多領域任務

首頁

Nvidia AceInstruct 7B GGUF

由bartowski開發

基於英偉達AceInstruct-7B模型的量化版本，使用llama.cpp進行量化，支持多種量化類型，適用於代碼、數學和通用領域任務。

大型語言模型 #指令微調模型 #多領域通用 #高精度量化

下載量 196

發布時間 : 2/12/2025

模型概述

這是一個7B參數的指令模型，經過量化處理以降低資源需求，同時保持較高的性能。適用於文本生成、代碼理解和數學推理等任務。

模型特點

多種量化選項

提供從F32到Q2_K的多種量化版本，滿足不同硬件和性能需求。

高性能推理

使用imatrix量化技術，保持模型性能的同時顯著減少資源佔用。

廣泛兼容性

支持在LM Studio、llama.cpp及基於llama.cpp的項目中運行。

嵌入和輸出權重優化

部分量化版本對嵌入和輸出權重進行特殊處理，進一步提升性能。

模型能力

文本生成

代碼理解

數學推理

指令跟隨

使用案例

編程輔助

代碼生成

根據自然語言描述生成代碼片段。

代碼解釋

解釋複雜代碼的功能和邏輯。

教育

數學問題解答

解決數學問題和提供解題步驟。

通用文本處理

內容創作

生成文章、故事或其他文本內容。

🚀 NVIDIA AceInstruct - 7B的Llamacpp imatrix量化版本

本項目使用 llama.cpp 的 b4688 版本進行量化。

原始模型：https://huggingface.co/nvidia/AceInstruct - 7B

所有量化模型均使用imatrix選項，並採用來自此處的數據集生成。

你可以在 LM Studio 中運行這些量化模型，也可以直接使用 llama.cpp 或任何基於llama.cpp的項目來運行。

✨ 主要特性

使用特定版本的llama.cpp進行量化處理。
提供多種量化類型的模型文件供選擇。
支持在不同環境（如LM Studio、llama.cpp項目）中運行。

📦 安裝指南

使用huggingface - cli下載

首先，確保你已經安裝了huggingface - cli：

pip install -U "huggingface_hub[cli]"

然後，你可以指定要下載的特定文件：

huggingface-cli download bartowski/nvidia_AceInstruct-7B-GGUF --include "nvidia_AceInstruct-7B-Q4_K_M.gguf" --local-dir ./

如果模型大小超過50GB，它會被分割成多個文件。若要將它們全部下載到本地文件夾，請運行：

huggingface-cli download bartowski/nvidia_AceInstruct-7B-GGUF --include "nvidia_AceInstruct-7B-Q8_0/*" --local-dir ./

你可以指定一個新的本地目錄（如nvidia_AceInstruct - 7B - Q8_0），也可以將它們全部下載到當前目錄（./）。

💻 使用示例

提示格式

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

📚 詳細文檔

下載文件選擇

文件名	量化類型	文件大小	分割情況	描述
AceInstruct-7B-f32.gguf	f32	30.47GB	false	完整的F32權重。
AceInstruct-7B-f16.gguf	f16	15.24GB	false	完整的F16權重。
AceInstruct-7B-Q8_0.gguf	Q8_0	8.10GB	false	極高質量，通常不需要，但為最大可用量化。
AceInstruct-7B-Q6_K_L.gguf	Q6_K_L	6.52GB	false	將嵌入和輸出權重量化為Q8_0。非常高質量，接近完美，推薦。
AceInstruct-7B-Q6_K.gguf	Q6_K	6.25GB	false	非常高質量，接近完美，推薦。
AceInstruct-7B-Q5_K_L.gguf	Q5_K_L	5.78GB	false	將嵌入和輸出權重量化為Q8_0。高質量，推薦。
AceInstruct-7B-Q5_K_M.gguf	Q5_K_M	5.44GB	false	高質量，推薦。
AceInstruct-7B-Q5_K_S.gguf	Q5_K_S	5.32GB	false	高質量，推薦。
AceInstruct-7B-Q4_K_L.gguf	Q4_K_L	5.09GB	false	將嵌入和輸出權重量化為Q8_0。質量良好，推薦。
AceInstruct-7B-Q4_1.gguf	Q4_1	4.87GB	false	舊格式，性能與Q4_K_S相似，但在Apple硅芯片上的每瓦令牌數有所提高。
AceInstruct-7B-Q4_K_M.gguf	Q4_K_M	4.68GB	false	質量良好，大多數用例的默認大小，推薦。
AceInstruct-7B-Q3_K_XL.gguf	Q3_K_XL	4.57GB	false	將嵌入和輸出權重量化為Q8_0。質量較低但可用，適合低內存情況。
AceInstruct-7B-Q4_K_S.gguf	Q4_K_S	4.46GB	false	質量略低，但節省更多空間，推薦。
AceInstruct-7B-Q4_0.gguf	Q4_0	4.44GB	false	舊格式，支持ARM和AVX CPU推理的在線重新打包。
AceInstruct-7B-IQ4_NL.gguf	IQ4_NL	4.44GB	false	與IQ4_XS相似，但略大。支持ARM CPU推理的在線重新打包。
AceInstruct-7B-IQ4_XS.gguf	IQ4_XS	4.22GB	false	質量不錯，比Q4_K_S小，性能相似，推薦。
AceInstruct-7B-Q3_K_L.gguf	Q3_K_L	4.09GB	false	質量較低但可用，適合低內存情況。
AceInstruct-7B-Q3_K_M.gguf	Q3_K_M	3.81GB	false	低質量。
AceInstruct-7B-IQ3_M.gguf	IQ3_M	3.57GB	false	中低質量，新方法，性能與Q3_K_M相當。
AceInstruct-7B-Q2_K_L.gguf	Q2_K_L	3.55GB	false	將嵌入和輸出權重量化為Q8_0。質量非常低，但出人意料地可用。
AceInstruct-7B-Q3_K_S.gguf	Q3_K_S	3.49GB	false	低質量，不推薦。
AceInstruct-7B-IQ3_XS.gguf	IQ3_XS	3.35GB	false	質量較低，新方法，性能不錯，略優於Q3_K_S。
AceInstruct-7B-IQ3_XXS.gguf	IQ3_XXS	3.11GB	false	質量較低，新方法，性能不錯，與Q3量化相當。
AceInstruct-7B-Q2_K.gguf	Q2_K	3.02GB	false	質量非常低，但出人意料地可用。
AceInstruct-7B-IQ2_M.gguf	IQ2_M	2.78GB	false	質量相對較低，使用了最先進的技術，出人意料地可用。