V

Videomae Small Finetuned Kinetics

Developed by MCG-NJU
VideoMAEは動画分野のマスクオートエンコーダモデルで、自己教師あり事前学習を行いKinetics-400データセットで教師ありファインチューニングされており、動画分類タスクに適しています。
Downloads 2,152
Release Time : 4/16/2023

Model Overview

このモデルはマスクオートエンコーダアーキテクチャに基づいており、動画分類タスク専用で、Kinetics-400データセットの400種類の動作カテゴリを識別できます。

Model Features

自己教師あり事前学習
1600エポックの自己教師あり事前学習により動画内部表現を学習
効率的な動画分類
Kinetics-400データセットでファインチューニング後、400種類の動作カテゴリを正確に識別可能
マスクオートエンコーダアーキテクチャ
マスクオートエンコーダ手法を用いた動画事前学習によりデータ効率を向上

Model Capabilities

動画分類
動作認識
動画特徴抽出

Use Cases

動画コンテンツ分析
動作認識
動画中の人間の動作を識別
Kinetics-400テストセットで79.0のtop-1精度を達成
動画分類
動画を400の事前定義カテゴリに分類
Kinetics-400テストセットで93.8のtop-5精度を達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase