V

Videomaev2 Huge

由OpenGVLab開發
VideoMAEv2-Huge是一個基於自監督學習的視頻特徵提取模型,在UnlabeldHybrid-1M數據集上進行了1200輪預訓練。
下載量 1,145
發布時間 : 1/14/2025

模型概述

該模型主要用於視頻特徵提取,採用雙掩碼策略進行預訓練,能夠有效捕捉視頻中的時空特徵。

模型特點

雙掩碼預訓練策略
採用雙掩碼策略進行自監督學習,提高模型對視頻時空特徵的理解能力
大規模預訓練
在UnlabeldHybrid-1M數據集上進行了1200輪預訓練,學習到豐富的視頻特徵表示
高效特徵提取
能夠從視頻中提取有意義的時空特徵,適用於下游視頻理解任務

模型能力

視頻特徵提取
視頻分類
視頻理解

使用案例

視頻分析
視頻內容分類
對視頻內容進行分類,如動作識別、場景識別等
視頻檢索
提取視頻特徵用於相似視頻檢索
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase