Q

Qwen2.5 VL 3B Instruct Quantized.w8a8

RedHatAIによって開発
Qwen/Qwen2.5-VL-3B-Instructの量子化バージョンで、視覚-テキスト入力とテキスト出力をサポートし、重みをINT8、活性化をINT8に量子化しています。
ダウンロード数 274
リリース時間 : 2/7/2025

モデル概要

このモデルはQwen/Qwen2.5-VL-3B-Instructの量子化バージョンで、視覚-言語タスクに適しており、効率的な推論展開をサポートします。

モデル特徴

効率的な量子化
重みをINT8、活性化をINT8に量子化し、推論効率を大幅に向上させます。
マルチモーダルサポート
視覚とテキスト入力をサポートし、複雑なマルチモーダルタスクに適しています。
高性能推論
vLLMバックエンドによる効率的な展開を実現し、シングルストリームとマルチストリーム非同期推論をサポートします。

モデル能力

視覚-テキスト理解
テキスト生成
マルチモーダル推論

使用事例

視覚質問応答
画像内容の説明
入力された画像に基づいて記述的なテキストを生成します。
VQAv2データセットで75.55の精度を達成しました。
ドキュメント理解
ドキュメント視覚質問応答
ドキュメント画像を解析し、関連する質問に答えます。
DocVQAデータセットで92.32のANLSスコアを達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase