G

Gemma 3 12b It

由 google 开发
Gemma是Google推出的轻量级前沿开源多模态模型系列,基于创建Gemini模型的技术构建,支持文本和图像输入并生成文本输出。
下载量 364.65k
发布时间 : 3/1/2025

模型简介

Gemma 3是多模态模型,能够处理文本和图像输入并生成文本响应。适用于问答、摘要、推理等多种任务,支持超过140种语言,具有128K的大上下文窗口。

模型特点

多模态能力
支持同时处理文本和图像输入,实现跨模态理解与生成
大上下文窗口
12B和27B模型支持128K tokens的上下文长度,适合处理长文档和复杂任务
多语言支持
训练数据包含超过140种语言,具备强大的多语言处理能力
高效部署
相对较小的体积使其能在笔记本电脑、台式机等资源有限环境中部署

模型能力

文本生成
图像理解
多语言处理
问答系统
文档摘要
逻辑推理
代码生成
数学计算

使用案例

内容生成
图像描述生成
根据输入图像生成详细描述
能准确识别图像内容并生成自然语言描述
文档摘要
对长文档进行自动摘要
生成简洁准确的摘要,保留关键信息
知识问答
基于图像的问答
回答关于图像内容的问题
能正确理解图像内容并回答相关问题
事实性问答
回答基于知识的各类问题
在多项基准测试中表现优异
教育辅助
数学问题解答
解决数学问题和解释解题步骤
在GSM8K等数学基准测试中表现良好
编程辅助
生成和解释代码
能处理多种编程语言的代码任务
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase