Q

Qwen2.5 VL 7B Instruct GPTQ Int4

Developed by hfl
Qwen2.5-VL-7B-Instruct-GPTQ-Int4はQwen2.5-VL-7B-Instructモデルを非公式にGPTQ-Int4量子化したバージョンで、画像からテキストへのマルチモーダルタスクをサポートします。
Downloads 872
Release Time : 2/24/2025

Model Overview

このモデルはマルチモーダルモデルで、画像とテキスト入力を処理し、対応するテキスト出力を生成できます。主に画像理解と生成タスクに使用されます。

Model Features

効率的な量子化
GPTQ-Int4量子化技術を採用し、モデルのディスク使用量とVRAM要件を大幅に削減しながら高い性能を維持します。
マルチモーダルサポート
画像とテキスト入力を同時に処理し、画像理解と生成を実現します。
高性能
ChartQAやOCRBenchなどのベンチマークテストで優れた性能を発揮し、元の非量子化モデルに近い性能を示します。
高い計算効率
AWQ量子化バージョンと比較して、GPTQモデルは推論時のVRAM使用量が少なく、速度が速いです。

Model Capabilities

画像理解
テキスト生成
画像質問応答
チャート分析
OCRテキスト認識

Use Cases

画像質問応答
画像説明生成
入力画像に基づいて詳細な文章説明を生成
画像の内容と詳細を正確に記述できます
チャート分析
チャート内容を解析し関連質問に回答
ChartQAテストで81.48点を獲得
ドキュメント処理
OCR強化
画像中の文字を認識し意味理解を実施
OCRBenchテストで845点を獲得
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase