G

Gemma 3 27b It FP8 Dynamic

由RedHatAI開發
這是google/gemma-3-27b-it的量化版本,採用FP8數據類型對權重進行量化,適用於視覺-文本輸入並輸出文本,可藉助vLLM高效部署進行推理。
下載量 1,608
發布時間 : 4/28/2025

模型概述

基於Gemma-3-27b-it模型的FP8量化版本,支持多模態輸入(視覺+文本)並生成文本輸出,優化了推理效率。

模型特點

FP8量化
權重和激活均採用FP8數據類型進行量化,顯著提升推理效率。
多模態支持
支持視覺和文本的聯合輸入,能夠理解圖像內容並生成相關文本。
高效部署
專為vLLM後端優化,支持高效推理部署。
高精度保持
量化後模型在多項基準測試中保持原始模型99%以上的準確率。

模型能力

圖像內容理解
多模態文本生成
視覺問答
上下文理解

使用案例

圖像理解
圖像內容描述
輸入圖像後生成對圖像內容的文字描述
準確識別圖像中的主要元素和場景
智能問答
視覺問答
基於圖像內容回答相關問題
在MMMU和ChartQA基準測試中表現優異
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase