Q

Qwen2.5 VL 72B Instruct FP8 Dynamic

由parasail-ai開發
Qwen2.5-VL-72B-Instruct的FP8量化版本,支持視覺-文本輸入和文本輸出,由Neural Magic優化發佈。
下載量 78
發布時間 : 4/18/2025

模型概述

這是一個基於Qwen2.5-VL-72B-Instruct的量化模型,通過FP8權重量化和激活量化優化,適用於多模態任務處理。

模型特點

FP8量化
採用FP8權重量化和激活量化技術,顯著減少模型大小和內存佔用
多模態支持
能夠同時處理視覺和文本輸入,執行復雜的多模態任務
高效推理
優化後可在vLLM框架下實現高效推理,支持單流和多流部署

模型能力

視覺問答
圖像描述生成
文檔理解
多模態推理
文本生成

使用案例

教育
教育內容理解
解析教材中的圖表和文字內容
在MMMU評估中達到66.88%準確率
商業
文檔分析
自動理解和提取商業文檔中的關鍵信息
在DocVQA評估中達到94.64%準確率
通用AI助手
多模態對話
基於圖像和文本輸入進行自然對話
在VQAv2評估中保持81.94%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase