G

Gemma 3 4b It Qat Int4 Unquantized

由google開發
Gemma 3是Google推出的輕量級多模態開放模型,支持文本和圖像輸入,生成文本輸出。4B版本經過指令調優和量化感知訓練,適合資源有限環境部署。
下載量 541
發布時間 : 4/9/2025

模型概述

基於Gemini技術構建的輕量級多模態模型,支持128K上下文窗口和140+種語言,適用於問答、摘要、推理等多種任務。

模型特點

多模態處理能力
支持同時處理文本和圖像輸入,實現跨模態理解與生成
量化感知訓練
採用QAT技術,可在保持質量的同時顯著降低內存需求
大上下文窗口
支持128K token的上下文長度,適合處理長文檔和複雜任務
多語言支持
訓練數據涵蓋140+種語言,具備跨語言處理能力

模型能力

文本生成
圖像內容分析
多語言處理
邏輯推理
代碼理解與生成
數學問題求解
文檔摘要

使用案例

內容生成
智能問答系統
基於文本或圖像輸入生成準確回答
在BoolQ基準測試達到82.4準確率
文檔摘要
自動生成長文檔的簡潔摘要
教育輔助
數學問題求解
解答各類數學題目並展示推理過程
在GSM8K基準測試達到82.6%準確率
編程教學
解釋代碼邏輯和生成示例代碼
在HumanEval基準測試達到48.8%準確率
視覺理解
圖像描述生成
為輸入圖像生成詳細文字描述
在COCOcap基準測試得分116
文檔信息提取
從掃描文檔中提取關鍵信息
在DocVQA基準測試達到85.6準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase