V

Videomae Base Finetuned

由sheraz179開發
基於MCG-NJU/videomae-base在未知數據集上微調的視頻理解模型,F1分數達到0.7147
下載量 15
發布時間 : 2/8/2023

模型概述

該模型是VideoMAE基礎架構的微調版本,專注於視頻內容理解任務,可能應用於視頻分類或行為識別等場景

模型特點

高效視頻表示學習
基於VideoMAE架構,通過掩碼自編碼預訓練有效學習視頻時空特徵
微調性能優異
在評估集上達到0.7147的F1分數,表明模型具有較強的判別能力
輕量級訓練
使用較小的批次大小(3)進行高效微調

模型能力

視頻特徵提取
視頻內容理解
時空模式識別

使用案例

視頻分析
行為識別
識別視頻中的人類行為或活動
F1分數0.7147
視頻分類
對視頻內容進行分類標註
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase