I

Internvideo2 Stage2 6B

由OpenGVLab開發
InternVideo2是一個多模態視頻理解模型,具有6B參數規模,專注於視頻內容分析和理解任務。
下載量 542
發布時間 : 2/10/2025

模型概述

該模型是InternVideo2項目的第二階段訓練成果,專注於視頻分類和理解任務,能夠處理視頻內容並執行文本檢索等任務。

模型特點

大規模參數
擁有6B參數規模,具備強大的視頻理解能力
多模態處理
能夠同時處理視頻和文本信息,實現跨模態理解
高效檢索
可以從視頻內容中高效檢索相關文本描述

模型能力

視頻內容分析
視頻特徵提取
文本-視頻檢索
多模態理解

使用案例

視頻內容理解
視頻場景描述
分析視頻內容並生成或匹配相應的文本描述
能夠準確匹配視頻內容與候選文本描述
智能監控
異常行為檢測
分析監控視頻中的異常行為
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase