QVQ-72B-Preview-GGUF開源模型 - 支持本地部署與推理，輕鬆實現便捷使用

QVQ 72B Preview GGUF

Developed by tensorblock

QVQ-72B-Preview的GGUF量化版本，適用於本地部署和推理。

Downloads 220

Release Time : 12/26/2024

Model Overview

這是一個72B參數規模的大型語言模型，經過GGUF格式量化，便於在本地環境中高效運行。

多種量化選項

提供從Q2_K到Q8_0多種量化級別，滿足不同場景需求

本地高效運行

GGUF格式優化了本地推理性能，降低硬件要求

與llama.cpp兼容

兼容最新版llama.cpp，便於集成到現有工作流

文本生成

對話系統

內容創作

代碼生成

內容創作

文章寫作

生成高質量的長篇文章

對話系統

智能助手

構建知識豐富的對話AI

本倉庫包含 Qwen/QVQ-72B-Preview 的 GGUF 格式模型文件。這些文件是使用 TensorBlock 提供的機器進行量化的，並且與截至提交 b4391 版本的 llama.cpp 兼容。

首先，安裝 Huggingface 客戶端：

pip install -U "huggingface_hub[cli]"

然後，將單個模型文件下載到本地目錄：

huggingface-cli download tensorblock/QVQ-72B-Preview-GGUF --include "QVQ-72B-Preview-Q2_K.gguf" --local-dir MY_LOCAL_DIR

如果您想按模式（例如 *Q4_K*gguf）下載多個模型文件，可以嘗試以下命令：

huggingface-cli download tensorblock/QVQ-72B-Preview-GGUF --local-dir MY_LOCAL_DIR --local-dir-use-symlinks False --include='*Q4_K*gguf'

項目名稱	項目詳情
Awesome MCP Servers	一個全面的模型上下文協議（MCP）服務器集合。 👉 查看項目 👈
TensorBlock Studio	一個輕量級、開放且可擴展的多大語言模型交互工作室。 👉 查看項目 👈

項目 A	項目 B

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant