X

Xgen Mm Phi3 Mini Base R V1.5

由 Salesforce 开发
xGen-MM是由Salesforce AI Research开发的一系列最新基础大语言模型(LMMs),在BLIP系列基础上改进,融入增强功能,具有更强大的基础能力。
下载量 830
发布时间 : 8/12/2024

模型简介

xGen-MM系列模型在高质量图像字幕数据集和交错图像文本数据上进行了大规模训练,支持多模态任务处理。

模型特点

多模态上下文学习
具备强大的多模态上下文学习能力,可处理图像和文本的复杂交互
高性能基准测试
在VQAv2、TextVQA、OKVQA等多个基准测试中表现优异
交错图像文本处理
专门优化的交错图像文本处理能力,适合复杂多模态场景

模型能力

图像理解
文本生成
多模态问答
图像字幕生成
上下文学习

使用案例

视觉问答
图像内容问答
根据图像内容回答相关问题
在VQAv2基准测试中达到66.9分
图像字幕生成
自动图像描述
为图像生成准确描述
在COCO基准测试中达到109.8分
多模态交互
复杂场景理解
处理包含多个图像和文本的复杂场景
在交错图像文本任务中表现优异
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase