G

Gemma 3n E2B It

由 google 开发
Gemma 3n是Google推出的轻量级、最先进的开源多模态模型家族,基于与Gemini模型相同的研究和技术构建。支持文本、音频和视觉输入,适用于多种任务。
下载量 1,183
发布时间 : 6/12/2025

模型简介

Gemma 3n是一个高效的多模态模型,能够处理文本、图像、视频和音频输入,并生成文本输出。专为在低资源设备上运行而设计,具有创新的参数管理技术。

模型特点

多模态输入支持
能够同时处理文本、图像、视频和音频输入,实现真正的多模态理解
高效参数管理
采用选择性参数激活技术,使2B有效参数的模型性能接近传统更大模型
低资源优化
专为在低资源设备上高效运行而设计,内存占用与传统2B模型相当
广泛语言支持
在超过140种语言的数据上进行训练,具备多语言处理能力

模型能力

文本生成
图像内容分析
视频内容理解
音频转录
多语言处理
代码生成
数学推理

使用案例

内容创作和通信
创意文本生成
生成诗歌、剧本、营销文案等创意内容
可生成符合要求的多样化创意文本
图像内容描述
分析图像内容并生成详细描述
能准确识别图像中的对象和场景
客户服务
多模态客服助手
通过文本、图像等多种方式与用户交互
提供准确的问题解答和指导
研究和教育
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase