V

Videomae Base Finetuned

由LouisDT開發
基於VideoMAE基礎模型在未知數據集上微調的視頻理解模型,在評估集上達到86.41%的準確率
下載量 15
發布時間 : 2/8/2023

模型概述

該模型是VideoMAE基礎架構的微調版本,主要用於視頻內容理解任務,具體應用場景需進一步補充

模型特點

高效視頻表示學習
採用掩碼自編碼器架構,能有效學習視頻的時空特徵表示
微調性能優異
在評估集上達到86.41%的準確率,表現良好
輕量級訓練
使用8的批次大小即可進行有效訓練

模型能力

視頻特徵提取
視頻內容分類
時空模式識別

使用案例

視頻內容分析
動作識別
識別視頻中的人類動作或行為
準確率86.41%(基於評估集)
場景分類
對視頻場景內容進行分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase