videomae-base-finetuned-kinetics-0408_final_45sec_orgオープンソース映像理解モデル

Videomae Base Finetuned Kinetics 0408 Final 45sec Org

d2o2jiによって開発

MCG-NJU/videomae-base-finetuned-kineticsをベースに微調整した動画理解モデルで、評価セットで90.97%の精度を達成

ダウンロード数 26

リリース時間 : 4/7/2025

モデル概要

このモデルはVideoMAEアーキテクチャに基づく動画分類モデルで、行動認識タスクに特化して最適化されています。

高精度

評価セットで90.97%の精度を達成

VideoMAEアーキテクチャ採用

動画マスク付き自己符号化器の事前学習フレームワークを採用

長尺動画処理

45秒の動画入力をサポート（モデル名から推測）

動画行動認識

時系列行動分析

動画内容理解

動画分析

行動認識

動画中の人間の行動を識別

精度90.97%

行動分析

動画中の時系列行動パターンを分析

インテリジェント監視

異常行動検知

監視カメラ映像中の異常な動作を検出