Q

Qwen2.5 VL 7B Instruct Quantized.w8a8

RedHatAIによって開発
Qwen2.5-VL-7B-Instructの量子化バージョンで、視覚-テキスト入力とテキスト出力をサポートし、INT8重み量子化により推論効率を最適化
ダウンロード数 1,992
リリース時間 : 2/7/2025

モデル概要

Qwen2.5-VL-7B-Instructを基にした量子化モデルで、効率的な視覚-言語タスク向けに設計されており、画像理解とテキスト生成を組み合わせるアプリケーションに適しています

モデル特徴

効率的なINT8量子化
W8A8量子化スキームを採用し、モデル性能を維持しながら推論効率を大幅に向上
マルチモーダルサポート
視覚とテキスト入力を同時に処理でき、画像理解とテキスト生成の統合タスクを実現
vLLM最適化
vLLM推論エンジン向けに最適化されており、効率的なデプロイと大規模サービスをサポート

モデル能力

ビジュアルQA
画像キャプション生成
マルチモーダル推論
ドキュメント理解
チャート分析

使用事例

教育
教材内容理解
教材中の図表やイラスト内容を学生が理解するのを支援
MMMUベンチマークで52.33%の精度を達成
ビジネス
ドキュメント分析
ビジネス文書中の表や図表情報を自動解析
DocVQAベンチマークで94.09 ANLSスコアを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase