G

Gemma 3 12b It Qat Int4 GGUF

由unsloth開發
Gemma 3是谷歌基於Gemini技術構建的輕量級開放模型系列,12B版本採用量化感知訓練(QAT)技術,支持多模態輸入和128K上下文窗口。
下載量 1,921
發布時間 : 4/25/2025

模型概述

Gemma 3是多模態模型,可處理文本和圖像輸入並生成文本輸出,提供預訓練和指令調優兩種變體。支持140多種語言,適用於問答、摘要和推理等任務。

模型特點

量化感知訓練(QAT)
採用QAT技術實現高效量化,在降低內存佔用的同時保持與bfloat16相近的模型質量
多模態處理
支持文本和圖像輸入(896x896分辨率),每張圖像編碼為256個token
超長上下文
12B模型支持128K token的上下文窗口長度
多語言支持
訓練數據涵蓋140多種語言,具備強大的跨語言能力

模型能力

文本生成
圖像內容分析
多語言處理
代碼生成
數學推理
視覺問答

使用案例

內容生成
自動摘要
對長文檔生成簡潔摘要
在TriviaQA基準測試中達到78.2分(5樣本)
創意寫作
根據提示生成故事或詩歌
知識問答
開放域問答
回答各類事實性問題
在Natural Questions基準測試中達到31.4分(5樣本)
視覺理解
圖像描述生成
為圖像生成自然語言描述
在COCO字幕基準測試中達到111分
文檔分析
解析文檔圖像中的內容和結構
在DocVQA驗證集上達到82.3分
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase