Q

Qwen2.5 VL 7B Instruct Quantized.w4a16

Developed by RedHatAI
Qwen2.5-VL-7B-Instructの量子化バージョンで、視覚-テキスト入力とテキスト出力をサポートし、重みはINT4、活性化はFP16に量子化されています。
Downloads 605
Release Time : 2/7/2025

Model Overview

これはQwen/Qwen2.5-VL-7B-Instructを基にした量子化モデルで、効率的な推論のために最適化されており、マルチモーダルタスクに適しています。

Model Features

効率的な量子化
重みをINT4、活性化をFP16に量子化することで、モデルサイズと推論コストを大幅に削減
マルチモーダルサポート
視覚とテキスト入力をサポートし、画像に関連するテキスト内容を理解・生成可能
vLLM最適化
vLLM推論エンジン向けに最適化されており、効率的な展開をサポート

Model Capabilities

視覚質問応答
画像キャプション生成
マルチモーダル対話
文書理解

Use Cases

視覚質問応答
画像内容理解
画像内容に関する自然言語質問に回答
VQAv2データセットで73.90%の精度を達成
文書処理
文書質問応答
スキャン文書やPDFから情報を抽出し質問に回答
DocVQAデータセットで94.13% ANLSスコアを達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase