Q

Qwen2.5 VL 3B Instruct GPTQ Int4

由hfl開發
這是Qwen2.5-VL-3B-Instruct模型的GPTQ-Int4量化版本,適用於圖像文本到文本的多模態任務,支持中文和英語。
下載量 1,312
發布時間 : 2/24/2025

模型概述

該模型是基於Qwen2.5-VL-3B-Instruct的GPTQ-Int4量化版本,主要用於處理圖像和文本的多模態任務,能夠生成與圖像相關的文本描述或回答相關問題。

模型特點

高效量化
通過GPTQ-Int4量化技術,顯著減少模型磁盤佔用和顯存需求,同時保持較高的性能。
多模態支持
能夠同時處理圖像和文本輸入,生成相關的文本輸出。
高性能
在ChartQA和OCRBench等基準測試中表現優異,接近原始模型的性能。

模型能力

圖像描述生成
圖像問答
多模態文本生成

使用案例

圖像理解
圖像描述
生成對輸入圖像的詳細描述。
輸出示例:這張圖片展示了一箇中文和英文的標誌,內容為“中文LLaMA & Alpaca大模型”和“Chinese LLaMA & Alpaca Large Language Models”。
圖像問答
回答與圖像內容相關的問題。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase