Mulberry_llava_8b开源AI模型 - 强大图像理解与文本生成，免费部署！

首页

Mulberry Llava 8b

由 HuanjinYao 开发

Mulberry-llava-8b是一个基于逐步推理的图像文本到文本模型，在Mulberry-260K SFT数据集上训练，具备强大的图像理解和文本生成能力。

图像生成文本

Transformers

开源协议:Apache-2.0 #多模态推理 #图像文本生成 #逐步推理优化

下载量 1,735

发布时间 : 1/8/2025

模型简介

该模型专注于图像与文本的交互处理，能够理解图像内容并生成相关文本，适用于多模态任务。

模型特点

逐步推理能力

通过CoMCTS集体知识搜索生成的训练数据，具备更强的逻辑推理能力。

多模态处理

能够同时处理图像和文本信息，实现跨模态理解与生成。

高效训练

使用LLaMA-Factory框架在8x NVIDIA H100上高效训练。

模型能力

图像内容理解

多模态文本生成

跨模态推理

使用案例

多模态交互

图像描述生成

根据输入图像生成详细的文字描述

视觉问答

回答关于图像内容的自然语言问题

属性	详情
模型类型	图像文本到文本模型
基础模型	llava-hf/llama3-llava-next-8b-hf
训练框架	LLaMA-Factory
硬件	8x NVIDIA H100

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Mulberry Llava 8b

模型简介

模型特点

模型能力

使用案例

🚀 Mulberry

🚀 快速开始

📚 详细文档

模型信息

训练相关

📄 许可证