G

Gemma 3n E2B

由 google 开发
Gemma 3n是谷歌推出的轻量级、最先进的开源模型家族,支持多模态输入和输出。
下载量 206
发布时间 : 6/12/2025

模型简介

Gemma 3n是基于与Gemini模型相同的研究和技术构建的轻量级开源模型,支持文本、音频和视觉(图像和视频)输入,适用于多种任务和数据格式。

模型特点

多模态支持
能够处理文本、图像、视频和音频输入,并生成文本输出。
架构创新
使用MatFormer架构,允许在E4B模型中嵌套子模型。
资源高效
通过将低利用率矩阵从加速器中卸载,该模型的内存占用与传统的2B模型相当。

模型能力

文本生成
图像分析
视频分析
音频分析
多模态推理

使用案例

内容创作
图像描述生成
根据输入的图像生成详细的文本描述。
生成准确且详细的图像描述。
研究和教育
多模态学习
利用多模态输入进行教育和研究任务。
提升学习和研究的效率。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase