G

Gemma 3 1b It Qat Int4 Unquantized

由google開發
Gemma是Google推出的輕量級先進開放模型系列,基於與Gemini相同技術構建,支持多模態輸入和文本生成。
下載量 507
發布時間 : 4/9/2025

模型概述

Gemma 3是多模態模型,可處理文本和圖像輸入並生成文本輸出,適用於問答、摘要和推理等任務。1B版本經過指令調優和量化感知訓練(QAT),適合資源有限環境部署。

模型特點

多模態處理能力
支持文本和圖像輸入,可執行跨模態任務如視覺問答和圖像內容分析
量化感知訓練(QAT)
採用QAT技術優化模型,顯著降低內存需求同時保持接近bfloat16的質量
大上下文窗口
1B版本支持32K token的輸入上下文和8K token的輸出生成
輕量級部署
小尺寸設計使其能在筆記本電腦、臺式機等資源有限環境中運行

模型能力

文本生成
圖像理解
多語言處理
代碼生成
數學推理
文檔摘要
視覺問答

使用案例

內容生成
自動文檔摘要
對長文檔進行關鍵信息提取和濃縮
生成簡潔準確的摘要
創意寫作輔助
根據提示生成故事、詩歌等創意內容
提供多樣化的創意輸出
知識問答
開放域問答
回答各類事實性和解釋性問題
在TriviaQA基準測試中達到39.8分(5-shot)
視覺問答
分析圖像內容並回答相關問題
在VQAv2基準測試中達63.9分(4B版本)
教育輔助
數學問題求解
解決代數、幾何等數學問題
在GSM8K基準測試中達38.4分(8-shot)
編程教學
解釋代碼概念和生成示例代碼
在HumanEval基準測試中達36分(0-shot)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase