llava-v1.5-13b-lora开源多模态聊天机器人 - 免费使用实现图文交互对话

Llava V1.5 13b Lora

由 liuhaotian 开发

LLaVA 是一个开源的多模态聊天机器人，通过对 LLaMA/Vicuna 进行微调，并基于 GPT 生成的多模态指令跟随数据训练而成。

下载量 143

发布时间 : 10/26/2023

模型简介

LLaVA 是一个基于 Transformer 架构的自回归语言模型，主要用于研究大型多模态模型和聊天机器人。

多模态能力

结合视觉和语言理解能力，能够处理图像和文本的联合任务

指令跟随

能够理解和执行基于多模态输入的复杂指令

开源模型

基于开源框架开发，可供研究和改进

图像理解

多模态对话

视觉问答

图像描述生成

多模态指令理解

学术研究

多模态模型研究

用于研究视觉语言联合表示和跨模态理解

聊天机器人开发

作为多模态聊天机器人的基础模型

教育应用

视觉辅助学习

帮助学生通过图像理解复杂概念

属性	详情
模型类型	LLaVA是通过在GPT生成的多模态指令跟随数据上微调LLaMA/Vicuna而训练的开源聊天机器人，它是基于Transformer架构的自回归语言模型。
模型日期	LLaVA - v1.5 - 13B - LoRA于2023年10月训练。
更多信息的论文或资源	https://llava-vl.github.io/