Q

Qwen2.5 VL 7B Instruct Quantized.w4a16

RedHatAIによって開発
Qwen2.5-VL-7B-Instructの量子化バージョンで、視覚-テキスト入力とテキスト出力をサポートし、重みはINT4、活性化はFP16に量子化されています。
ダウンロード数 605
リリース時間 : 2/7/2025

モデル概要

これはQwen/Qwen2.5-VL-7B-Instructを基にした量子化モデルで、効率的な推論のために最適化されており、マルチモーダルタスクに適しています。

モデル特徴

効率的な量子化
重みをINT4、活性化をFP16に量子化することで、モデルサイズと推論コストを大幅に削減
マルチモーダルサポート
視覚とテキスト入力をサポートし、画像に関連するテキスト内容を理解・生成可能
vLLM最適化
vLLM推論エンジン向けに最適化されており、効率的な展開をサポート

モデル能力

視覚質問応答
画像キャプション生成
マルチモーダル対話
文書理解

使用事例

視覚質問応答
画像内容理解
画像内容に関する自然言語質問に回答
VQAv2データセットで73.90%の精度を達成
文書処理
文書質問応答
スキャン文書やPDFから情報を抽出し質問に回答
DocVQAデータセットで94.13% ANLSスコアを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase