G

Gemma 3 4b It Qat Q4 0 Unquantized

由google開發
Gemma 3是Google推出的輕量級開源多模態模型,基於與Gemini相同技術構建,支持文本和圖像輸入並生成文本輸出。
下載量 1,159
發布時間 : 4/8/2025

模型概述

Gemma 3是一個多模態模型,能夠處理文本和圖像輸入並生成文本輸出。它擁有128K的大上下文窗口,支持超過140種語言,適用於問答、摘要和推理等多種任務。

模型特點

多模態能力
支持文本和圖像輸入,能夠理解和分析圖像內容並生成相關文本輸出。
大上下文窗口
擁有128K的大上下文窗口,能夠處理更長的輸入序列。
多語言支持
支持超過140種語言,適用於全球範圍內的多語言任務。
輕量級設計
相對較小的體積使其能夠在資源有限的環境中部署,如筆記本電腦、臺式機或雲基礎設施。
量化感知訓練
使用量化感知訓練(QAT),能夠在降低內存需求的同時保持與bfloat16相似的性能。

模型能力

文本生成
圖像分析
問答
摘要
推理
代碼生成
數學問題解決
多語言處理

使用案例

問答系統
開放域問答
回答用戶提出的各種問題,提供準確的信息。
在BoolQ基準測試中,4B模型達到72.3的準確率。
文檔處理
文檔摘要
自動生成長文檔的簡潔摘要。
圖像理解
圖像描述生成
分析圖像內容並生成描述性文本。
在COCOcap基準測試中,4B模型得分為102。
教育
數學問題解答
解決各種數學問題並提供詳細步驟。
在GSM8K基準測試中,4B模型達到38.4的準確率。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase