G

Gemma 3 4b Pt

由axolotl-mirrors開發
Gemma 3是谷歌推出的輕量級、最先進的開放模型家族,基於與Gemini模型相同的研究和技術構建。它支持多模態,能處理文本和圖像輸入並生成文本輸出,適用於多種文本生成和圖像理解任務。
下載量 4,332
發布時間 : 3/30/2025

模型概述

Gemma 3是一個多模態模型,能夠處理文本和圖像輸入並生成文本輸出,適用於多種文本生成和圖像理解任務。

模型特點

多模態處理
能夠處理文本和圖像輸入,並生成文本輸出。
大上下文窗口
擁有128K的大上下文窗口,支持超過140種語言。
資源友好
相對較小的模型規模,可在筆記本電腦、臺式機或自有云基礎設施等資源有限的環境中部署。

模型能力

文本生成
圖像理解
多語言支持
多模態處理

使用案例

文本生成
文本摘要
生成文本的摘要。
問答系統
回答用戶提出的問題。
圖像理解
圖像描述
生成圖像的文本描述。
在COCOcap基準測試中得分116。
文檔理解
理解文檔中的內容。
在DocVQA基準測試中得分85.6。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase