Q

Qwen2.5 VL 7B Instruct FP8 Dynamic

由RedHatAI開發
Qwen2.5-VL-7B-Instruct的FP8量化版本,通過vLLM支持高效視覺-文本推理
下載量 25.18k
發布時間 : 2/6/2025

模型概述

基於Qwen2.5-VL-7B-Instruct的FP8動態量化模型,支持視覺-文本輸入和文本輸出,適用於多模態理解和生成任務

模型特點

FP8動態量化
權重和激活均採用FP8量化技術,在保持模型精度的同時提升推理效率
vLLM優化支持
專為vLLM推理引擎優化,支持高效部署和推理加速
多模態理解
支持視覺和文本的聯合輸入,能夠理解和分析圖像內容

模型能力

視覺問答
圖像內容理解
文檔解析
圖表分析
數學視覺推理
多模態文本生成

使用案例

文檔處理
文檔視覺問答
解析和理解文檔圖像中的內容並回答問題
在DocVQA數據集上達到94.27 ANLS分數
視覺推理
圖表分析
理解和解釋圖表數據
在ChartQA測試集上達到86.80%準確率
數學視覺問題解答
解決包含視覺元素的數學問題
在Mathvista測試集上達到71.07%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase