V

Videomae Small Finetuned Kinetics

MCG-NJUによって開発
VideoMAEは動画分野のマスクオートエンコーダモデルで、自己教師あり事前学習を行いKinetics-400データセットで教師ありファインチューニングされており、動画分類タスクに適しています。
ダウンロード数 2,152
リリース時間 : 4/16/2023

モデル概要

このモデルはマスクオートエンコーダアーキテクチャに基づいており、動画分類タスク専用で、Kinetics-400データセットの400種類の動作カテゴリを識別できます。

モデル特徴

自己教師あり事前学習
1600エポックの自己教師あり事前学習により動画内部表現を学習
効率的な動画分類
Kinetics-400データセットでファインチューニング後、400種類の動作カテゴリを正確に識別可能
マスクオートエンコーダアーキテクチャ
マスクオートエンコーダ手法を用いた動画事前学習によりデータ効率を向上

モデル能力

動画分類
動作認識
動画特徴抽出

使用事例

動画コンテンツ分析
動作認識
動画中の人間の動作を識別
Kinetics-400テストセットで79.0のtop-1精度を達成
動画分類
動画を400の事前定義カテゴリに分類
Kinetics-400テストセットで93.8のtop-5精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase