Q

Qwen2.5 VL 3B Instruct FP8 Dynamic

RedHatAIによって開発
Qwen2.5-VL-3B-InstructのFP8量子化バージョンで、視覚-テキスト入力とテキスト出力をサポートし、推論効率を最適化しています。
ダウンロード数 112
リリース時間 : 2/6/2025

モデル概要

このモデルはQwen2.5-VL-3B-Instructの量子化バージョンで、FP8重み量子化と活性化量子化を最適化し、vLLMを使用した効率的な推論をサポートします。マルチモーダル理解と生成タスクに適しています。

モデル特徴

FP8量子化
重み量子化と活性化量子化がFP8で、推論効率を大幅に向上させます。
マルチモーダルサポート
視覚-テキスト入力とテキスト出力をサポートし、複雑なマルチモーダルタスクに適しています。
効率的な推論
最適化によりvLLMを使用した効率的なデプロイをサポートし、推論速度を向上させます。

モデル能力

視覚的質問応答
画像キャプション生成
マルチモーダル推論
文書理解
チャート分析

使用事例

教育
教育コンテンツ理解
教材内の画像とテキスト内容を解析し、学習を支援します。
MMMU検証セットで45.78%の精度を達成。
ビジネス
文書分析
ビジネス文書内の画像とテキスト情報を自動解析します。
DocVQA検証セットで92.40%のANLSスコアを達成。
研究
科学チャート理解
科学論文内のチャートとデータを解析します。
ChartQAテストセットで80.72%の緩やかな正解率を達成。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase