Q

QVQ 72B Preview GGUF

Developed by XelotX
QVQ-72B-Preview是基於llamacpp的imatrix量化版本的多模態大語言模型,支持圖像和文本的多模態理解與生成。
Downloads 288
Release Time : 12/26/2024

Model Overview

該模型是QwenVL系列的多模態大語言模型,能夠處理圖像和文本的聯合輸入,執行視覺問答、圖像描述等任務。

Model Features

多種量化類型
提供從Q8_0到IQ1_M等多種量化類型,滿足不同硬件配置下的性能和質量需求。
在線重打包
部分量化類型支持在線重打包,可根據硬件情況自動優化性能。
多模態支持
能夠同時處理圖像和文本輸入,執行視覺問答等任務。
性能優化
通過合理選擇量化類型和配置,可在不同硬件上實現性能的優化。

Model Capabilities

視覺問答
圖像描述生成
多模態理解
文本生成

Use Cases

視覺問答
手指數數
識別圖像中手部的數量並回答問題
準確識別圖像中的手指數量
圖像理解
場景描述
生成對輸入圖像的詳細描述
生成準確且詳細的圖像描述
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase