V

Videomaev2 Huge

由 OpenGVLab 开发
VideoMAEv2-Huge是一个基于自监督学习的视频特征提取模型,在UnlabeldHybrid-1M数据集上进行了1200轮预训练。
下载量 1,145
发布时间 : 1/14/2025

模型简介

该模型主要用于视频特征提取,采用双掩码策略进行预训练,能够有效捕捉视频中的时空特征。

模型特点

双掩码预训练策略
采用双掩码策略进行自监督学习,提高模型对视频时空特征的理解能力
大规模预训练
在UnlabeldHybrid-1M数据集上进行了1200轮预训练,学习到丰富的视频特征表示
高效特征提取
能够从视频中提取有意义的时空特征,适用于下游视频理解任务

模型能力

视频特征提取
视频分类
视频理解

使用案例

视频分析
视频内容分类
对视频内容进行分类,如动作识别、场景识别等
视频检索
提取视频特征用于相似视频检索
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase