P

Pixtral 12b Quantized.w8a8

RedHatAIによって開発
mgoin/pixtral-12bをベースとしたINT8量子化バージョン、視覚-テキストマルチモーダルタスクをサポート、推論効率を最適化
ダウンロード数 309
リリース時間 : 2/8/2025

モデル概要

これはINT8重み量子化と活性化量子化を施したマルチモーダルモデルで、視覚入力とテキスト出力をサポートし、画像理解と生成タスクに適しています

モデル特徴

効率的なINT8量子化
重み量子化と活性化量子化ともにINT8で、推論効率を大幅に向上
マルチモーダルサポート
視覚入力とテキスト出力をサポート、画像とテキストの連携タスクを処理可能
vLLM最適化
vLLM推論エンジン向けに特別最適化、効率的なデプロイをサポート
高精度維持
量子化後も元のモデルの97%以上の精度を維持

モデル能力

視覚質問応答
画像内容記述
ドキュメント理解
チャート分析
マルチモーダル推論

使用事例

視覚質問応答
画像内容理解
画像内容に関する自然言語質問に回答
VQAv2検証セットで78.00精度を達成
ドキュメント分析
ドキュメントQA
スキャン文書から情報抽出し質問に回答
DocVQA検証セットで89.35 ANLSスコアを達成
チャート理解
チャートデータ分析
チャート内容を解釈し関連質問に回答
ChartQAテストセットで81.60精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase