G

Gemma 3 4b It Quantized.w4a16

由 RedHatAI 开发
基于google/gemma-3-4b-it的量化版本,采用INT4权重量化和FP16激活量化,优化推理效率
下载量 195
发布时间 : 6/4/2025

模型简介

Gemma 3 4B指令调优模型的量化版本,支持视觉-文本输入和文本输出,适用于多模态推理任务

模型特点

高效量化
采用INT4权重量化和FP16激活量化,显著降低计算资源需求
多模态支持
支持图像和文本的联合输入,实现视觉-语言理解与生成
高性能推理
通过vLLM后端优化,实现高效的推理速度
高精度保持
量化后平均性能恢复率达97.42%,视觉任务恢复率达98.86%

模型能力

图像内容理解
多模态对话
视觉问答
文本生成

使用案例

视觉内容分析
图像描述生成
分析输入图像并生成自然语言描述
在MMMU验证集达到40.11%准确率
图表理解
解析图表内容并回答相关问题
在ChartQA达到49.32%准确率
智能对话
多模态聊天助手
结合图像和文本输入进行自然对话
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase