Q

Qwen2.5 VL 72B Instruct Quantized.w4a16

由 RedHatAI 开发
Qwen2.5-VL-72B-Instruct的INT4权重量化版本,支持视觉-文本输入和文本输出,通过vLLM实现高效推理
下载量 1,328
发布时间 : 2/7/2025

模型简介

这是一个72B参数的多模态大语言模型量化版本,支持视觉和文本输入,专为高效推理优化

模型特点

高效量化
权重量化为INT4数据类型,激活量化为FP16,显著降低计算资源需求
多模态支持
同时处理视觉和文本输入,输出为文本响应
高性能推理
通过vLLM实现高效部署,单流部署可达3.95倍加速,多流异步部署可达6.6倍加速
高精度保持
量化后模型在视觉任务上平均保持99.51%的原始精度

模型能力

图像内容理解
视觉问答
文档分析
图表理解
数学视觉推理
多语言文本生成

使用案例

视觉问答
图像内容描述
分析图像内容并生成描述性文本
在VQAv2验证集上达到81.87%准确率
文档理解
解析文档图像并回答相关问题
在DocVQA验证集上达到94.72% ANLS分数
视觉推理
数学视觉问题解答
解决包含数学公式和图表的问题
在Mathvista测试迷你集上达到77.68%准确率
图表分析
解释图表数据并回答相关问题
在ChartQA测试集上达到88.96%准确率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase