L

Llava V1.5 13b Lora

由 liuhaotian 开发
LLaVA 是一个开源的多模态聊天机器人,通过对 LLaMA/Vicuna 进行微调,并基于 GPT 生成的多模态指令跟随数据训练而成。
下载量 143
发布时间 : 10/26/2023

模型简介

LLaVA 是一个基于 Transformer 架构的自回归语言模型,主要用于研究大型多模态模型和聊天机器人。

模型特点

多模态能力
结合视觉和语言理解能力,能够处理图像和文本的联合任务
指令跟随
能够理解和执行基于多模态输入的复杂指令
开源模型
基于开源框架开发,可供研究和改进

模型能力

图像理解
多模态对话
视觉问答
图像描述生成
多模态指令理解

使用案例

学术研究
多模态模型研究
用于研究视觉语言联合表示和跨模态理解
聊天机器人开发
作为多模态聊天机器人的基础模型
教育应用
视觉辅助学习
帮助学生通过图像理解复杂概念
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase