Q

Qwen2.5 VL 3B Instruct FP8 Dynamic

由RedHatAI開發
Qwen2.5-VL-3B-Instruct的FP8量化版本,支持視覺-文本輸入和文本輸出,優化了推理效率。
下載量 112
發布時間 : 2/6/2025

模型概述

該模型是基於Qwen2.5-VL-3B-Instruct的量化版本,通過FP8權重量化和激活量化優化,支持使用vLLM進行高效推理。適用於多模態理解和生成任務。

模型特點

FP8量化
權重量化和激活量化均為FP8,顯著提升推理效率。
多模態支持
支持視覺-文本輸入和文本輸出,適用於複雜的多模態任務。
高效推理
優化後支持使用vLLM進行高效部署,提升推理速度。

模型能力

視覺問答
圖像描述生成
多模態推理
文檔理解
圖表分析

使用案例

教育
教育內容理解
解析教育材料中的圖像和文本內容,輔助學習。
在MMMU驗證集上達到45.78%的準確率。
商業
文檔分析
自動解析商業文檔中的圖像和文本信息。
在DocVQA驗證集上達到92.40%的ANLS分數。
研究
科學圖表理解
解析科學論文中的圖表和數據。
在ChartQA測試集上達到80.72%的寬鬆正確率。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase