Q

Qwen2.5 VL 3B Instruct Quantized.w8a8

由RedHatAI開發
Qwen/Qwen2.5-VL-3B-Instruct的量化版本,支持視覺-文本輸入和文本輸出,權重量化為INT8,激活量化為INT8。
下載量 274
發布時間 : 2/7/2025

模型概述

該模型是Qwen/Qwen2.5-VL-3B-Instruct的量化版本,適用於視覺-語言任務,支持高效的推理部署。

模型特點

高效量化
權重量化為INT8,激活量化為INT8,顯著提升推理效率。
多模態支持
支持視覺和文本輸入,適用於複雜的多模態任務。
高性能推理
通過vLLM後端實現高效部署,支持單流和多流異步推理。

模型能力

視覺-文本理解
文本生成
多模態推理

使用案例

視覺問答
圖片內容描述
根據輸入的圖片生成描述性文本。
在VQAv2數據集上達到75.55的準確率。
文檔理解
文檔視覺問答
解析文檔圖片並回答相關問題。
在DocVQA數據集上達到92.32的ANLS分數。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase