L

Llava NeXT Video 34B Hf

由llava-hf開發
LLaVA-NeXT-Video是一個開源多模態聊天機器人,通過視頻和圖像數據混合訓練,具備優秀的視頻理解能力。
下載量 2,232
發布時間 : 6/6/2024

模型概述

基於LLaVA-NeXT構建的視頻理解模型,通過在視頻和圖像數據的混合上進行調優,在VideoMME基準測試中表現領先。

模型特點

視頻理解能力
通過均勻採樣32幀處理視頻內容,具備優秀的視頻理解能力
多模態指令跟隨
能夠理解和執行基於視頻和圖像的多模態指令
開源模型領先者
目前在VideoMME基準測試中處於開源模型的領先地位

模型能力

視頻內容理解
多模態對話
視頻問答
視頻內容描述

使用案例

視頻內容分析
視頻問答系統
基於視頻內容回答用戶提出的問題
在VideoMME基準測試中表現優異
視頻內容摘要
生成視頻內容的文字描述和摘要
教育應用
教學視頻分析
幫助學生理解教學視頻內容並回答問題
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase