P

Pixtral 12b Quantized.w8a8

Developed by RedHatAI
基於mgoin/pixtral-12b的INT8量化版本,支持視覺-文本多模態任務,優化了推理效率
Downloads 309
Release Time : 2/8/2025

Model Overview

這是一個經過INT8權重量化和激活量化的多模態模型,支持視覺輸入和文本輸出,適用於圖像理解和生成任務

Model Features

高效INT8量化
權重量化和激活量化均為INT8,顯著提升推理效率
多模態支持
支持視覺輸入和文本輸出,能夠處理圖像和文本的聯合任務
vLLM優化
專為vLLM推理引擎優化,支持高效部署
高精度保持
量化後保持了原始模型97%以上的準確率

Model Capabilities

視覺問答
圖像內容描述
文檔理解
圖表分析
多模態推理

Use Cases

視覺問答
圖像內容理解
回答關於圖像內容的自然語言問題
在VQAv2驗證集上達到78.00準確率
文檔分析
文檔問答
從掃描文檔中提取信息並回答問題
在DocVQA驗證集上達到89.35 ANLS分數
圖表理解
圖表數據分析
解釋圖表內容並回答相關問題
在ChartQA測試集上達到81.60準確率
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase