G

Gemma 3n E4B

由 google 开发
Gemma 3n是谷歌推出的轻量级多模态模型,基于Transformer架构,支持文本、音频和视觉(图像和视频)输入,适用于低资源设备。
下载量 131
发布时间 : 6/3/2025

模型简介

Gemma 3n是一款高效的多模态模型,支持文本、音频和视觉输入,适用于内容创作、研究教育等多个领域。

模型特点

多模态支持
支持文本、音频、图像和视频输入,能够处理多种类型的任务。
高效运行
采用选择性参数激活技术,内存占用与传统4B模型相当,适合低资源设备。
架构创新
使用MatFormer架构,允许嵌套子模型,支持自定义大小的模型。
多语言支持
训练数据包含超过140种语言,具备良好的跨语言处理能力。

模型能力

文本生成
图像分析
音频转录
视频内容理解
多语言处理

使用案例

内容创作和通信
创意文本生成
生成诗歌、脚本、代码、营销文案和电子邮件草稿。
图像内容分析
提取、解释和总结视觉数据以进行文本通信。
研究和教育
自然语言处理研究
作为研究人员试验生成式模型和NLP技术的基础。
语言学习工具
支持交互式语言学习体验,有助于语法纠正或提供写作练习。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase