Q

Qwen2.5 VL 7B Instruct FP8 Dynamic

由 RedHatAI 开发
Qwen2.5-VL-7B-Instruct的FP8量化版本,通过vLLM支持高效视觉-文本推理
下载量 25.18k
发布时间 : 2/6/2025

模型简介

基于Qwen2.5-VL-7B-Instruct的FP8动态量化模型,支持视觉-文本输入和文本输出,适用于多模态理解和生成任务

模型特点

FP8动态量化
权重和激活均采用FP8量化技术,在保持模型精度的同时提升推理效率
vLLM优化支持
专为vLLM推理引擎优化,支持高效部署和推理加速
多模态理解
支持视觉和文本的联合输入,能够理解和分析图像内容

模型能力

视觉问答
图像内容理解
文档解析
图表分析
数学视觉推理
多模态文本生成

使用案例

文档处理
文档视觉问答
解析和理解文档图像中的内容并回答问题
在DocVQA数据集上达到94.27 ANLS分数
视觉推理
图表分析
理解和解释图表数据
在ChartQA测试集上达到86.80%准确率
数学视觉问题解答
解决包含视觉元素的数学问题
在Mathvista测试集上达到71.07%准确率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase