LLaVA-NeXT-Video-7B開源多模態對話機器人 - 免費支持視頻與文本交互

Llava NeXT Video 7B

由lmms-lab開發

LLaVA-Next-Video 是一款開源的多模態對話機器人，通過大語言模型微調訓練而成，支持視頻和文本的多模態交互。

下載量 1,146

發布時間 : 4/16/2024

模型概述

LLaVA-Next-Video 是一款基於大型語言模型的開源對話機器人，專注於多模態指令跟隨任務，支持視頻和文本的交互。

多模態交互

支持視頻和文本的多模態輸入，能夠理解和生成與視頻內容相關的文本響應。

開源模型

完全開源，允許研究人員和開發者自由使用和修改。

指令跟隨

經過多模態指令跟隨數據的微調，能夠準確執行復雜的多模態任務。

視頻-文本對話

多模態指令理解

視頻內容分析

文本生成

研究

多模態模型研究

用於計算機視覺和自然語言處理領域的研究，探索多模態模型的潛力。

教育

視頻內容問答

用於教育場景中，學生可以通過視頻提問，模型生成相關解答。

屬性	詳情
模型類型	LLaVA-Next-Video是一個通過在多模態指令跟隨數據上微調大語言模型（LLM）訓練得到的開源聊天機器人。基礎大語言模型為lmsys/vicuna-7b-v1.5。
模型日期	LLaVA-Next-Video-7B於2024年4月訓練完成。
更多信息資源	https://github.com/LLaVA-VL/LLaVA-NeXT