V

Videomae Base Short Finetuned Kinetics

由 MCG-NJU 开发
VideoMAE是基于掩码自编码器(MAE)的视频自监督预训练模型,在Kinetics-400数据集上微调用于视频分类任务。
下载量 62
发布时间 : 8/2/2022

模型简介

该模型通过自监督方式预训练800轮次,并在Kinetics-400数据集上进行监督微调,能够将视频分类为400个可能类别之一。

模型特点

自监督预训练
采用掩码自编码器(MAE)方法进行自监督预训练,减少对标注数据的依赖
高效视频表征学习
能够学习视频的内部表征,提取下游任务所需的特征
高准确率
在Kinetics-400测试集上达到79.4%的top-1准确率和94.1%的top-5准确率

模型能力

视频分类
视频特征提取

使用案例

视频内容分析
视频分类
将视频分类为Kinetics-400数据集的400个类别之一
在Kinetics-400测试集上达到79.4%的top-1准确率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase