QVQ-72B-Preview-GGUF開源多模態大模型 - 免費實現圖像與文本理解生成

Home

QVQ 72B Preview GGUF

Developed by XelotX

QVQ-72B-Preview是基於llamacpp的imatrix量化版本的多模態大語言模型，支持圖像和文本的多模態理解與生成。

文本生成圖像 EnglishOpen Source License:Other #多模態視覺問答 #72B參數量化 #imatrix優化

Downloads 288

Release Time : 12/26/2024

Model Overview

該模型是QwenVL系列的多模態大語言模型，能夠處理圖像和文本的聯合輸入，執行視覺問答、圖像描述等任務。

Model Features

多種量化類型

提供從Q8_0到IQ1_M等多種量化類型，滿足不同硬件配置下的性能和質量需求。

在線重打包

部分量化類型支持在線重打包，可根據硬件情況自動優化性能。

多模態支持

能夠同時處理圖像和文本輸入，執行視覺問答等任務。

性能優化

通過合理選擇量化類型和配置，可在不同硬件上實現性能的優化。

Model Capabilities

視覺問答

圖像描述生成

多模態理解

文本生成

Use Cases

視覺問答

手指數數

識別圖像中手部的數量並回答問題

準確識別圖像中的手指數量

圖像理解

場景描述

生成對輸入圖像的詳細描述

生成準確且詳細的圖像描述

🚀 QVQ-72B-Preview的Llamacpp imatrix量化版本

本項目是QVQ-72B-Preview模型基於llamacpp的imatrix量化版本，提供了多種量化類型的模型文件，方便不同硬件配置和使用場景下的部署與應用。

🚀 快速開始

運行方式

QwenVL模型需要使用llama-qwen2vl-cli工具，示例命令如下：

./llama-qwen2vl-cli -m /models/QVQ-72B-Preview-Q4_K_M.gguf \
  --mmproj /models/mmproj-QVQ-72B-Preview-f16.gguf \
  -p 'How many fingers does this hand have.' \
  --image '/models/hand.jpg'

提示詞格式

<|im_start|>system
{system_prompt}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

✨ 主要特性

多種量化類型：提供了豐富的量化類型供選擇，如Q8_0、Q6_K、Q5_K_L等，滿足不同的質量和性能需求。
在線重打包：部分量化類型支持在線重打包，可根據硬件情況自動優化性能。
性能優化：通過合理選擇量化類型和配置，可在不同硬件上實現性能的優化。

📦 安裝指南

安裝huggingface-cli

首先，確保你已經安裝了huggingface-cli：

pip install -U "huggingface_hub[cli]"

下載指定文件

你可以指定要下載的特定文件，例如：

huggingface-cli download bartowski/QVQ-72B-Preview-GGUF --include "QVQ-72B-Preview-Q4_K_M.gguf" --local-dir ./

下載拆分文件

如果模型大小超過50GB，它會被拆分成多個文件。要將它們全部下載到本地文件夾，請運行：

huggingface-cli download bartowski/QVQ-72B-Preview-GGUF --include "QVQ-72B-Preview-Q8_0/*" --local-dir ./

你可以指定一個新的本地目錄（如QVQ-72B-Preview-Q8_0），也可以將它們全部下載到當前目錄（./）。

💻 使用示例

基礎用法

使用llama-qwen2vl-cli工具運行模型的基本命令如下：

./llama-qwen2vl-cli -m /models/QVQ-72B-Preview-Q4_K_M.gguf \
  --mmproj /models/mmproj-QVQ-72B-Preview-f16.gguf \
  -p 'How many fingers does this hand have.' \
  --image '/models/hand.jpg'

📚 詳細文檔

模型文件下載

你可以從以下鏈接下載不同量化類型的模型文件：

文件名	量化類型	文件大小	是否拆分	描述
QVQ-72B-Preview-Q8_0.gguf	Q8_0	77.26GB	true	極高質量，通常不需要，但提供了最大可用的量化。
QVQ-72B-Preview-Q6_K.gguf	Q6_K	64.35GB	true	非常高質量，接近完美，推薦。
QVQ-72B-Preview-Q5_K_L.gguf	Q5_K_L	55.22GB	true	嵌入和輸出權重使用Q8_0。高質量，推薦。
QVQ-72B-Preview-Q5_K_M.gguf	Q5_K_M	54.45GB	true	高質量，推薦。
QVQ-72B-Preview-Q5_K_S.gguf	Q5_K_S	51.38GB	true	高質量，推薦。
QVQ-72B-Preview-Q4_K_L.gguf	Q4_K_L	48.34GB	false	嵌入和輸出權重使用Q8_0。質量良好，推薦。
QVQ-72B-Preview-Q4_K_M.gguf	Q4_K_M	47.42GB	false	質量良好，大多數用例的默認大小，推薦。
QVQ-72B-Preview-Q4_1.gguf	Q4_1	45.70GB	false	舊格式，性能與Q4_K_S相似，但在Apple硅芯片上提高了每瓦令牌數。
QVQ-72B-Preview-Q4_K_S.gguf	Q4_K_S	43.89GB	false	質量稍低，但節省更多空間，推薦。
QVQ-72B-Preview-Q4_0.gguf	Q4_0	41.38GB	false	舊格式，為ARM和AVX CPU推理提供在線重打包。
QVQ-72B-Preview-IQ4_NL.gguf	IQ4_NL	41.32GB	false	類似於IQ4_XS，但稍大。為ARM CPU推理提供在線重打包。
QVQ-72B-Preview-Q3_K_XL.gguf	Q3_K_XL	40.60GB	false	嵌入和輸出權重使用Q8_0。質量較低但可用，適合低內存情況。
QVQ-72B-Preview-IQ4_XS.gguf	IQ4_XS	39.71GB	false	質量不錯，比Q4_K_S小，性能相似，推薦。
QVQ-72B-Preview-Q3_K_L.gguf	Q3_K_L	39.51GB	false	質量較低但可用，適合低內存情況。
QVQ-72B-Preview-Q3_K_M.gguf	Q3_K_M	37.70GB	false	低質量。
QVQ-72B-Preview-IQ3_M.gguf	IQ3_M	35.50GB	false	中低質量，新方法，性能與Q3_K_M相當。
QVQ-72B-Preview-Q3_K_S.gguf	Q3_K_S	34.49GB	false	低質量，不推薦。
QVQ-72B-Preview-IQ3_XXS.gguf	IQ3_XXS	31.85GB	false	質量較低，新方法，性能與Q3量化相當。
QVQ-72B-Preview-Q2_K_L.gguf	Q2_K_L	31.03GB	false	嵌入和輸出權重使用Q8_0。質量非常低，但令人驚訝地可用。
QVQ-72B-Preview-Q2_K.gguf	Q2_K	29.81GB	false	質量非常低，但令人驚訝地可用。
QVQ-72B-Preview-IQ2_M.gguf	IQ2_M	29.34GB	false	質量相對較低，使用SOTA技術，令人驚訝地可用。
QVQ-72B-Preview-IQ2_S.gguf	IQ2_S	27.94GB	false	質量較低，使用SOTA技術可用。
QVQ-72B-Preview-IQ2_XS.gguf	IQ2_XS	27.06GB	false	質量較低，使用SOTA技術可用。
QVQ-72B-Preview-IQ2_XXS.gguf	IQ2_XXS	25.49GB	false	質量非常低，使用SOTA技術可用。
QVQ-72B-Preview-IQ1_M.gguf	IQ1_M	23.74GB	false	質量極低，不推薦。