G

Gemma 3 27b It FP8 Dynamic

由 RedHatAI 开发
这是google/gemma-3-27b-it的量化版本,采用FP8数据类型对权重进行量化,适用于视觉-文本输入并输出文本,可借助vLLM高效部署进行推理。
下载量 1,608
发布时间 : 4/28/2025

模型简介

基于Gemma-3-27b-it模型的FP8量化版本,支持多模态输入(视觉+文本)并生成文本输出,优化了推理效率。

模型特点

FP8量化
权重和激活均采用FP8数据类型进行量化,显著提升推理效率。
多模态支持
支持视觉和文本的联合输入,能够理解图像内容并生成相关文本。
高效部署
专为vLLM后端优化,支持高效推理部署。
高精度保持
量化后模型在多项基准测试中保持原始模型99%以上的准确率。

模型能力

图像内容理解
多模态文本生成
视觉问答
上下文理解

使用案例

图像理解
图像内容描述
输入图像后生成对图像内容的文字描述
准确识别图像中的主要元素和场景
智能问答
视觉问答
基于图像内容回答相关问题
在MMMU和ChartQA基准测试中表现优异
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase