videomae-base-finetuned-ucf101-subsetオープンソース動画分類モデル

Videomae Base Finetuned Ucf101 Subset

koya1によって開発

VideoMAEベースモデルをUCF101サブセットでファインチューニングしたビデオ分類モデル

ダウンロード数 14

リリース時間 : 2/24/2023

モデル概要

このモデルはVideoMAEベースアーキテクチャをUCF101データセットのサブセットでファインチューニングしたビデオ分類モデルで、主にビデオ行動認識タスクに使用されます。

効率的なビデオ表現学習

VideoMAEアーキテクチャを採用し、マスク付き自己エンコーダーの事前学習を通じてビデオの時空間的特徴表現を学習

特定ドメインファインチューニング

UCF101行動認識データセットのサブセットでファインチューニングを行い、特定のビデオ分類タスクに適応

軽量推論

ベース版モデルは適度な規模で、実際のデプロイメントアプリケーションに適しています

ビデオ行動認識

時空間特徴抽出

ビデオ分類

ビデオ分析

行動認識

ビデオ中の人間の行動を認識

評価セットで83.24%の精度を達成

ビデオコンテンツ分類

ビデオコンテンツを分類してラベル付け