G

Gemma 3 12b It Quantized.w8a8

由 RedHatAI 开发
基于google/gemma-3-12b-it的INT8量化版本,支持视觉文本输入和文本输出,适用于高效推理部署
下载量 237
发布时间 : 6/4/2025

模型简介

这是一个量化版本的多模态模型,基于Gemma-3-12b-it进行权重量化处理,可借助vLLM高效部署,适用于视觉文本输入、文本输出的场景

模型特点

高效量化
采用INT8权重量化和INT8激活量化,显著减少模型大小和内存占用
多模态支持
支持图像和文本的联合输入,进行跨模态理解和生成
高效推理
通过vLLM后端实现高效部署,支持批处理和流式输出
高精度保持
量化后模型在多项基准测试中保持接近原始模型的性能

模型能力

图像内容理解
多模态对话
文本生成
视觉问答

使用案例

内容理解
图像描述生成
根据输入图像生成自然语言描述
能准确描述图像中的主要内容和场景
视觉问答
回答关于图像内容的自然语言问题
在MMMU和ChartQA基准测试中表现良好
智能助手
多模态对话
结合图像和文本输入进行自然对话
能理解图像上下文并生成相关回复
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase