Q

Qwen2.5 VL 3B Instruct GPTQ Int3

由hfl開發
Qwen2.5-VL-3B-Instruct的GPTQ-Int3量化版本,適用於多模態圖像文本處理任務,顯存佔用更少,推理速度更快。
下載量 60
發布時間 : 3/20/2025

模型概述

這是一個基於Qwen2.5-VL-3B-Instruct模型的GPTQ-Int3量化版本,專注於圖像與文本的多模態交互任務,如視覺問答和OCR識別。

模型特點

高效量化
採用GPTQ-Int3量化技術,顯著減少模型磁盤佔用和顯存需求
多模態支持
同時處理圖像和文本輸入,實現視覺語言交互
性能保留
在量化後仍保持較高的任務性能,如ChartQA和OCRBench
計算效率
相比AWQ量化版本,顯存佔用更少,推理速度更快

模型能力

圖像描述生成
視覺問答
OCR文本識別
多模態交互

使用案例

教育
圖表理解
幫助學生理解複雜圖表中的數據
在ChartQA測試集上達到76.68分
文檔處理
OCR增強
識別並理解掃描文檔中的圖文內容
在OCRBench上達到742分
內容審核
多模態內容分析
同時分析圖像和文本內容進行審核
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase