Q

Qwen2.5 VL 7B Instruct GPTQ Int4

由hfl開發
Qwen2.5-VL-7B-Instruct-GPTQ-Int4是基於Qwen2.5-VL-7B-Instruct模型進行非官方GPTQ-Int4量化的版本,支持圖文到文本的多模態任務。
下載量 872
發布時間 : 2/24/2025

模型概述

該模型是一個多模態模型,能夠處理圖像和文本輸入,生成相應的文本輸出。主要用於圖文理解和生成任務。

模型特點

高效量化
採用GPTQ-Int4量化技術,顯著減少模型磁盤佔用和顯存需求,同時保持較高性能。
多模態支持
能夠同時處理圖像和文本輸入,實現圖文理解和生成。
高性能
在ChartQA和OCRBench等基準測試中表現優異,接近原始非量化模型性能。
計算效率高
相比AWQ量化版本,GPTQ模型在推理時顯存佔用更少,速度更快。

模型能力

圖像理解
文本生成
圖文問答
圖表分析
OCR文本識別

使用案例

圖文問答
圖像描述生成
根據輸入圖像生成詳細的文字描述
能夠準確描述圖像內容和細節
圖表分析
解析圖表內容並回答相關問題
在ChartQA測試中獲得81.48分
文檔處理
OCR增強
識別圖像中的文字並進行語義理解
在OCRBench測試中獲得845分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase