Llama-3.1-Nemotron-Nano-8B-v1-GGUF開源大語言模型 - 8B參數多量化版本免費可用

首頁

Llama 3.1 Nemotron Nano 8B V1 GGUF

由tensorblock開發

NVIDIA發佈的8B參數規模的開源大語言模型，基於Llama-3架構，提供多種量化版本

大型語言模型英語開源協議:其他 #輕量級8B模型 #多輪對話優化 #GGUF高效推理

下載量 1,048

發布時間 : 3/18/2025

模型概述

這是一個基於Llama-3架構的8B參數規模的大語言模型，由NVIDIA發佈。模型提供了多種量化版本，適用於不同硬件環境。

模型特點

多種量化版本

提供從Q2_K到Q8_0共12種量化版本，滿足不同硬件環境和性能需求

高效推理

優化的GGUF格式，適合在資源有限的設備上運行

Llama-3架構

基於最新的Llama-3架構，提供良好的文本生成能力

模型能力

文本生成

對話系統

內容創作

使用案例

對話系統

智能助手

可用於構建英文智能對話助手

內容生成

文章創作

可用於輔助英文文章寫作

🚀 nvidia/Llama-3.1-Nemotron-Nano-8B-v1 - GGUF

本項目提供了nvidia/Llama-3.1-Nemotron-Nano-8B-v1的GGUF格式模型文件。這些文件能夠助力文本生成任務，為相關領域的研究和應用提供有力支持。

反饋與支持：可通過TensorBlock的 Twitter/X、Telegram群組和 Discord服務器獲取。

📚 詳細文檔

模型概述

本倉庫包含了 nvidia/Llama-3.1-Nemotron-Nano-8B-v1 的GGUF格式模型文件。這些文件由 TensorBlock 提供的機器進行量化，並且與 commit b4882 版本的 llama.cpp 兼容。

我們的項目

項目名稱	項目介紹	項目鏈接
Awesome MCP Servers	一個全面的模型上下文協議（MCP）服務器集合。	點擊查看
TensorBlock Studio	一個輕量級、開放且可擴展的多LLM交互工作室。	點擊查看

提示模板

<|begin_of_text|><|start_header_id|>system<|end_header_id|>

{system_prompt}<|eot_id|><|start_header_id|>user<|end_header_id|>

{prompt}<|eot_id|><|start_header_id|>assistant<|end_header_id|>

模型文件規格

文件名	量化類型	文件大小	描述
Llama-3.1-Nemotron-Nano-8B-v1-Q2_K.gguf	Q2_K	3.179 GB	最小，但質量損失顯著，不建議用於大多數場景
Llama-3.1-Nemotron-Nano-8B-v1-Q3_K_S.gguf	Q3_K_S	3.665 GB	非常小，但質量損失高
Llama-3.1-Nemotron-Nano-8B-v1-Q3_K_M.gguf	Q3_K_M	4.019 GB	非常小，但質量損失高
Llama-3.1-Nemotron-Nano-8B-v1-Q3_K_L.gguf	Q3_K_L	4.322 GB	小，質量損失較大
Llama-3.1-Nemotron-Nano-8B-v1-Q4_0.gguf	Q4_0	4.661 GB	舊版本；小，質量損失非常高，建議使用Q3_K_M
Llama-3.1-Nemotron-Nano-8B-v1-Q4_K_S.gguf	Q4_K_S	4.693 GB	小，質量損失更大
Llama-3.1-Nemotron-Nano-8B-v1-Q4_K_M.gguf	Q4_K_M	4.921 GB	中等，質量平衡，推薦使用
Llama-3.1-Nemotron-Nano-8B-v1-Q5_0.gguf	Q5_0	5.599 GB	舊版本；中等，質量平衡，建議使用Q4_K_M
Llama-3.1-Nemotron-Nano-8B-v1-Q5_K_S.gguf	Q5_K_S	5.599 GB	大，質量損失低，推薦使用
Llama-3.1-Nemotron-Nano-8B-v1-Q5_K_M.gguf	Q5_K_M	5.733 GB	大，質量損失非常低，推薦使用
Llama-3.1-Nemotron-Nano-8B-v1-Q6_K.gguf	Q6_K	6.596 GB	非常大，質量損失極低
Llama-3.1-Nemotron-Nano-8B-v1-Q8_0.gguf	Q8_0	8.541 GB	非常大，質量損失極低，不建議使用

下載說明

命令行方式

首先，安裝Huggingface客戶端：

pip install -U "huggingface_hub[cli]"

然後，將單個模型文件下載到本地目錄：

huggingface-cli download tensorblock/Llama-3.1-Nemotron-Nano-8B-v1-GGUF --include "Llama-3.1-Nemotron-Nano-8B-v1-Q2_K.gguf" --local-dir MY_LOCAL_DIR

如果你想按模式（例如 *Q4_K*gguf）下載多個模型文件，可以嘗試以下命令：

huggingface-cli download tensorblock/Llama-3.1-Nemotron-Nano-8B-v1-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'