G

Gemma 3 12b It Qat Q4 0 Unquantized

由google開發
Gemma 3是Google基於Gemini技術打造的輕量級開源多模態模型系列,支持文本和圖像輸入並生成文本輸出。12B版本經過指令調優和量化感知訓練(QAT),適合資源有限環境部署。
下載量 1,159
發布時間 : 4/8/2025

模型概述

Gemma 3是一個多模態模型,能夠處理文本和圖像輸入並生成文本響應。該模型具有128K的大上下文窗口,支持140多種語言,適用於問答、摘要、推理等多種任務。

模型特點

多模態能力
支持同時處理文本和圖像輸入,實現跨模態理解與生成
大上下文窗口
128K token的上下文長度,適合處理長文檔和複雜任務
量化感知訓練
採用QAT技術,可在量化後保持與bfloat16相近的質量,降低內存需求
多語言支持
支持140多種語言,具備全球應用潛力

模型能力

文本生成
圖像理解
多語言處理
問答系統
文檔摘要
邏輯推理
代碼生成

使用案例

內容生成
自動摘要
對長文檔或文章生成簡潔摘要
在Natural Questions基準上5-shot達到31.4分(12B版本)
創意寫作
根據提示生成故事、詩歌等創意內容
知識問答
開放域問答
回答各種領域的知識性問題
在TriviaQA基準上5-shot達到78.2分(12B版本)
教育輔助
數學問題解答
解決數學題目並解釋步驟
在GSM8K基準上8-shot達到71.0分(12B版本)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase