G

Gemma 3 12b It Qat Int4 Unquantized

由google開發
Gemma 3是Google推出的輕量級多模態開放模型,支持文本和圖像輸入,生成文本輸出,具有128K大上下文窗口和多語言能力。
下載量 1,358
發布時間 : 4/9/2025

模型概述

Gemma 3是基於Gemini技術構建的輕量級開放模型系列,12B版本經過指令調優和量化感知訓練(QAT),適合文本生成、圖像理解等任務,可在資源有限環境中部署。

模型特點

多模態能力
支持文本和圖像輸入,能處理複雜的多模態任務
大上下文窗口
128K token的上下文長度,適合處理長文檔和複雜任務
量化感知訓練
採用QAT技術,可在保持質量的同時顯著降低內存需求
多語言支持
支持超過140種語言,具備全球適用性

模型能力

文本生成
圖像內容分析
多語言處理
問答系統
文檔摘要
邏輯推理
代碼生成
數學問題解決

使用案例

內容生成
自動摘要
對長文檔生成簡潔準確的摘要
在Natural Questions基準上達到36.1分(5-shot)
創意寫作
根據提示生成故事、詩歌等創意內容
視覺理解
圖像描述
為圖像生成詳細的文字描述
在COCOcap基準上達到116分
文檔分析
從掃描文檔中提取和理解信息
在DocVQA基準上達到85.6分
教育
數學輔導
解答數學問題並解釋解題步驟
在GSM8K基準上達到82.6分(8-shot)
語言學習
提供多語言翻譯和學習輔助
在WMT24++基準上達到55.7分(ChrF)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase