G

Gemma 3 4b Pt

由 axolotl-mirrors 开发
Gemma 3是谷歌推出的轻量级、最先进的开放模型家族,基于与Gemini模型相同的研究和技术构建。它支持多模态,能处理文本和图像输入并生成文本输出,适用于多种文本生成和图像理解任务。
下载量 4,332
发布时间 : 3/30/2025

模型简介

Gemma 3是一个多模态模型,能够处理文本和图像输入并生成文本输出,适用于多种文本生成和图像理解任务。

模型特点

多模态处理
能够处理文本和图像输入,并生成文本输出。
大上下文窗口
拥有128K的大上下文窗口,支持超过140种语言。
资源友好
相对较小的模型规模,可在笔记本电脑、台式机或自有云基础设施等资源有限的环境中部署。

模型能力

文本生成
图像理解
多语言支持
多模态处理

使用案例

文本生成
文本摘要
生成文本的摘要。
问答系统
回答用户提出的问题。
图像理解
图像描述
生成图像的文本描述。
在COCOcap基准测试中得分116。
文档理解
理解文档中的内容。
在DocVQA基准测试中得分85.6。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase