G

Gemma 3 12b Pt

由google開發
Gemma是Google推出的輕量級開源多模態模型系列,基於與Gemini相同技術構建,支持文本和圖像輸入並生成文本輸出。
下載量 54.36k
發布時間 : 3/1/2025

模型概述

Gemma 3是多模態模型,能夠處理文本和圖像輸入並生成文本輸出,適用於問答、摘要和推理等多種任務。擁有128K大上下文窗口,支持140多種語言。

模型特點

多模態處理能力
能夠同時處理文本和圖像輸入,實現跨模態理解與生成
大上下文窗口
支持128K token的上下文長度,適合處理長文檔和複雜任務
多語言支持
支持140多種語言的處理,具備國際化能力
輕量級設計
相對較小的體積使其能在資源有限的環境中部署

模型能力

文本生成
圖像理解
問答系統
文檔摘要
邏輯推理
代碼生成
數學計算
多語言處理

使用案例

內容生成
圖像描述生成
根據輸入圖像生成詳細描述
示例中準確描述了蜜蜂在粉色花朵上的場景
文檔摘要
對長文檔進行自動摘要
問答系統
基於圖像的問答
回答關於圖像內容的問題
事實性問答
回答基於知識的問題
在TriviaQA基準測試中達到78.2分(12B模型)
教育
數學問題解答
解決數學問題和證明
在GSM8K基準測試中達到71.0分(12B模型)
編程輔助
代碼生成和解釋
在HumanEval基準測試中達到45.7分(12B模型)
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase