P

Pllava 7b

Developed by ermu2001
PLLaVA是一款开源的视频语言聊天机器人,通过在视频指令跟随数据上微调图像大语言模型而得,可用于多模态大模型和聊天机器人的研究。
Downloads 109
Release Time : 4/24/2024

Model Overview

PLLaVA是一个基于Transformer架构的自回归语言模型,通过在视频指令跟随数据上微调图像大语言模型训练得到,主要用于大型多模态模型和聊天机器人的研究。

Model Features

视频语言理解
能够理解和处理视频内容相关的语言指令
多模态能力
结合视觉和语言模态进行理解和生成
开源研究工具
为多模态大模型研究提供开源基础

Model Capabilities

视频内容理解
多模态对话
指令跟随
视觉问答

Use Cases

学术研究
多模态模型研究
用于探索视频与语言结合的多模态模型架构
聊天机器人开发
作为视频对话机器人的基础模型
应用开发
视频内容分析
自动分析视频内容并生成描述
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase