P

Pllava 7b

由 ermu2001 开发
PLLaVA是一款开源的视频语言聊天机器人,通过在视频指令跟随数据上微调图像大语言模型而得,可用于多模态大模型和聊天机器人的研究。
下载量 109
发布时间 : 4/24/2024

模型简介

PLLaVA是一个基于Transformer架构的自回归语言模型,通过在视频指令跟随数据上微调图像大语言模型训练得到,主要用于大型多模态模型和聊天机器人的研究。

模型特点

视频语言理解
能够理解和处理视频内容相关的语言指令
多模态能力
结合视觉和语言模态进行理解和生成
开源研究工具
为多模态大模型研究提供开源基础

模型能力

视频内容理解
多模态对话
指令跟随
视觉问答

使用案例

学术研究
多模态模型研究
用于探索视频与语言结合的多模态模型架构
聊天机器人开发
作为视频对话机器人的基础模型
应用开发
视频内容分析
自动分析视频内容并生成描述
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase