V

Videomae Small Finetuned Kinetics

由MCG-NJU開發
VideoMAE是視頻領域的掩碼自編碼器模型,通過自監督預訓練並在Kinetics-400數據集上進行監督微調,適用於視頻分類任務。
下載量 2,152
發布時間 : 4/16/2023

模型概述

該模型基於掩碼自編碼器架構,專門用於視頻分類任務,能夠識別Kinetics-400數據集中的400種動作類別。

模型特點

自監督預訓練
通過1600個週期的自監督預訓練學習視頻內部表示
高效視頻分類
在Kinetics-400數據集上微調後,能夠準確識別400種動作類別
掩碼自編碼器架構
採用掩碼自編碼器方法進行視頻預訓練,提高數據效率

模型能力

視頻分類
動作識別
視頻特徵提取

使用案例

視頻內容分析
動作識別
識別視頻中的人類動作
在Kinetics-400測試集上達到79.0的top-1準確率
視頻分類
將視頻分類到400個預定義類別中
在Kinetics-400測試集上達到93.8的top-5準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase