Q

Qwen2.5 VL 72B Instruct Quantized.w4a16

由RedHatAI開發
Qwen2.5-VL-72B-Instruct的INT4權重量化版本,支持視覺-文本輸入和文本輸出,通過vLLM實現高效推理
下載量 1,328
發布時間 : 2/7/2025

模型概述

這是一個72B參數的多模態大語言模型量化版本,支持視覺和文本輸入,專為高效推理優化

模型特點

高效量化
權重量化為INT4數據類型,激活量化為FP16,顯著降低計算資源需求
多模態支持
同時處理視覺和文本輸入,輸出為文本響應
高性能推理
通過vLLM實現高效部署,單流部署可達3.95倍加速,多流異步部署可達6.6倍加速
高精度保持
量化後模型在視覺任務上平均保持99.51%的原始精度

模型能力

圖像內容理解
視覺問答
文檔分析
圖表理解
數學視覺推理
多語言文本生成

使用案例

視覺問答
圖像內容描述
分析圖像內容並生成描述性文本
在VQAv2驗證集上達到81.87%準確率
文檔理解
解析文檔圖像並回答相關問題
在DocVQA驗證集上達到94.72% ANLS分數
視覺推理
數學視覺問題解答
解決包含數學公式和圖表的問題
在Mathvista測試迷你集上達到77.68%準確率
圖表分析
解釋圖表數據並回答相關問題
在ChartQA測試集上達到88.96%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase