QwQ-32B-GGUF開源模型 - 適用於本地免費部署與推理的實用工具

Qwq 32B GGUF

由tensorblock開發

QwQ-32B的GGUF格式量化版本，適用於本地部署和推理

下載量 1,312

發布時間 : 3/5/2025

模型概述

本倉庫包含Qwen/QwQ-32B的GGUF格式模型文件，由TensorBlock提供的機器進行量化，兼容llama.cpp。

多量化版本

提供從Q2_K到Q8_0共12種量化版本，滿足不同硬件和性能需求

llama.cpp兼容

兼容截至b4823提交版本的llama.cpp，便於本地部署

聊天優化

提供專門的提示詞模板，優化聊天交互體驗

文本生成

對話交互

對話系統

智能聊天助手

部署本地聊天機器人

內容生成

文本創作

生成各類文本內容

本倉庫包含 Qwen/QwQ-32B 的 GGUF 格式模型文件。這些文件由 TensorBlock 提供的機器進行量化，並且與截至提交 b4823 的 llama.cpp 兼容。

反饋與支持：可通過 TensorBlock 的 Twitter/X、Telegram 群組和 Discord 服務器獲取。

項目名稱	項目介紹	項目圖片	項目鏈接
Awesome MCP Servers	一個全面的模型上下文協議（MCP）服務器集合。		查看項目
TensorBlock Studio	一個輕量級、開放且可擴展的多大語言模型交互工作室。		查看項目

首先，安裝 Huggingface 客戶端：

pip install -U "huggingface_hub[cli]"

然後，將單個模型文件下載到本地目錄：

huggingface-cli download tensorblock/QwQ-32B-GGUF --include "QwQ-32B-Q2_K.gguf" --local-dir MY_LOCAL_DIR

如果你想按模式（例如 *Q4_K*gguf）下載多個模型文件，可以嘗試：

huggingface-cli download tensorblock/QwQ-32B-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant
<think>