videomae-base-finetuned-kineticsオープンソース動画理解モデル - 評価セットの正解率は91.23%に達する

Videomae Base Finetuned Kinetics 0409 Final 5sec Org Ab7 Val As123 Retry

d2o2jiによって開発

MCG-NJU/videomae-base-finetuned-kineticsをベースに微調整した動画理解モデルで、評価セットで91.23%の精度を達成

ダウンロード数 30

リリース時間 : 4/9/2025

モデル概要

このモデルはVideoMAEアーキテクチャに基づく動画分類モデルで、行動認識タスクに特化して最適化されています。

高精度

評価セットで91.23%の精度を達成

VideoMAEアーキテクチャ採用

動画マスク自己符号化事前学習フレームワークを採用

5秒動画処理

5秒間の動画クリップ処理に特化して最適化

動画行動認識

動画分類

時系列行動理解

動画分析

行動認識

動画中の人間の動作や行動を識別

精度91.23%

動画コンテンツ分類

動画クリップを自動分類