Q

Qwen2.5 VL 7B Instruct FP8 Dynamic

Developed by RedHatAI
Qwen2.5-VL-7B-InstructのFP8量子化バージョンで、vLLMを通じて効率的なビジュアル - テキスト推論をサポートします。
Downloads 25.18k
Release Time : 2/6/2025

Model Overview

Qwen2.5-VL-7B-Instructに基づくFP8動的量子化モデルで、ビジュアル - テキスト入力とテキスト出力をサポートし、マルチモーダル理解と生成タスクに適しています。

Model Features

FP8動的量子化
重みと活性化関数の両方にFP8量子化技術を採用し、モデルの精度を維持しながら推論効率を向上させます。
vLLM最適化サポート
vLLM推論エンジン用に最適化されており、効率的なデプロイと推論の高速化をサポートします。
マルチモーダル理解
ビジュアルとテキストの連合入力をサポートし、画像内容を理解し分析することができます。

Model Capabilities

ビジュアル質問応答
画像内容理解
ドキュメント解析
グラフ分析
数学的ビジュアル推論
マルチモーダルテキスト生成

Use Cases

ドキュメント処理
ドキュメントビジュアル質問応答
ドキュメント画像の内容を解析し理解し、質問に回答します。
DocVQAデータセットで94.27 ANLSスコアを達成しました。
ビジュアル推論
グラフ分析
グラフデータを理解し解釈します。
ChartQAテストセットで86.80%の正解率を達成しました。
数学的ビジュアル問題解決
ビジュアル要素を含む数学問題を解決します。
Mathvistaテストセットで71.07%の正解率を達成しました。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase