G

Gemma 3 27b It Qat Autoawq

由gaunernst開發
Gemma 3是Google推出的輕量級前沿開放模型系列,基於與Gemini相同技術構建,支持多模態輸入(文本/圖像)和文本輸出。27B版本通過量化感知訓練顯著降低內存需求。
下載量 789
發布時間 : 4/6/2025

模型概述

多模態開放權重模型,支持128K上下文窗口和140+語言,適用於問答、摘要、推理等任務,特別優化了資源受限環境的部署能力。

模型特點

量化感知訓練
採用QAT技術實現4-bit量化,內存需求顯著降低的同時保持接近bfloat16的模型質量
多模態支持
可同時處理文本和圖像輸入(896x896分辨率),實現跨模態理解與生成
超長上下文
支持128K令牌的輸入上下文窗口,適合處理長文檔和複雜任務
多語言能力
訓練數據涵蓋140+種語言,具備跨語言理解和生成能力

模型能力

文本生成
圖像內容分析
多語言處理
代碼理解與生成
數學推理
文檔摘要
視覺問答

使用案例

內容生成
創意寫作
生成詩歌、故事等創意文本
示例顯示能生成符合主題的連貫詩文
技術文檔摘要
自動生成長文檔的簡明摘要
在128K上下文窗口內有效提取關鍵信息
視覺理解
圖像描述生成
為輸入圖像生成自然語言描述
在COCOcap基準測試達到116分(27B模型)
文檔視覺問答
回答基於掃描文檔內容的問題
DocVQA驗證集準確率85.6%
教育輔助
數學問題求解
分步解決數學應用題
GSM8K基準8-shot準確率82.6%
編程教學
解釋代碼片段或生成示例代碼
HumanEval基準0-shot通過率48.8%
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase