M

Mulberry Llava 8b

由 HuanjinYao 开发
Mulberry-llava-8b是一个基于逐步推理的图像文本到文本模型,在Mulberry-260K SFT数据集上训练,具备强大的图像理解和文本生成能力。
下载量 1,735
发布时间 : 1/8/2025

模型简介

该模型专注于图像与文本的交互处理,能够理解图像内容并生成相关文本,适用于多模态任务。

模型特点

逐步推理能力
通过CoMCTS集体知识搜索生成的训练数据,具备更强的逻辑推理能力。
多模态处理
能够同时处理图像和文本信息,实现跨模态理解与生成。
高效训练
使用LLaMA-Factory框架在8x NVIDIA H100上高效训练。

模型能力

图像内容理解
多模态文本生成
跨模态推理

使用案例

多模态交互
图像描述生成
根据输入图像生成详细的文字描述
视觉问答
回答关于图像内容的自然语言问题
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase