videomae-base-finetuned-kinetics-0409オープンソース動画理解モデル

Videomae Base Finetuned Kinetics 0409 Final 5sec Org Ab7 Val Inside Train

d2o2jiによって開発

このモデルはMCG-NJU/videomae-base-finetuned-kineticsをベースにファインチューニングしたバージョンで、主に動画理解タスクに使用され、評価データセットで91.38%の精度を達成しました。

ダウンロード数 17

リリース時間 : 4/9/2025

モデル概要

これはVideoMAEアーキテクチャに基づく動画理解モデルで、ファインチューニング後に動画行動認識などのタスクに使用できます。

高精度

評価データセットで91.38%の精度を達成

VideoMAEアーキテクチャベース

自己教師あり学習の動画マスクオートエンコーダーアーキテクチャを採用

ファインチューニング版

MCG-NJU/videomae-base-finetuned-kineticsをベースにさらにファインチューニング

動画行動認識

動画内容理解

動画分析

行動認識

動画中の人間の行動を認識

精度91.38%

行動分析

動画中の行動パターンを分析