G

Gemma 3 4b It Quantized.w4a16

Developed by RedHatAI
基於google/gemma-3-4b-it的量化版本,採用INT4權重量化和FP16激活量化,優化推理效率
Downloads 195
Release Time : 6/4/2025

Model Overview

Gemma 3 4B指令調優模型的量化版本,支持視覺-文本輸入和文本輸出,適用於多模態推理任務

Model Features

高效量化
採用INT4權重量化和FP16激活量化,顯著降低計算資源需求
多模態支持
支持圖像和文本的聯合輸入,實現視覺-語言理解與生成
高性能推理
通過vLLM後端優化,實現高效的推理速度
高精度保持
量化後平均性能恢復率達97.42%,視覺任務恢復率達98.86%

Model Capabilities

圖像內容理解
多模態對話
視覺問答
文本生成

Use Cases

視覺內容分析
圖像描述生成
分析輸入圖像並生成自然語言描述
在MMMU驗證集達到40.11%準確率
圖表理解
解析圖表內容並回答相關問題
在ChartQA達到49.32%準確率
智能對話
多模態聊天助手
結合圖像和文本輸入進行自然對話
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase