V

Videomae Base Finetuned Kinetics

MCG-NJUによって開発
VideoMAEはマスクオートエンコーダ(MAE)に基づく動画自己教師あり事前学習モデルで、Kinetics-400データセットでファインチューニング後、動画分類タスクに使用可能です。
ダウンロード数 44.91k
リリース時間 : 7/8/2022

モデル概要

このモデルは自己教師あり方式で事前学習され、Kinetics-400データセットで教師ありファインチューニングされており、動画を400の可能なカテゴリのいずれかに分類できます。

モデル特徴

自己教師あり事前学習
マスクオートエンコーダ(MAE)手法を用いた自己教師あり事前学習により、動画内部表現を学習
効率的な動画表現
マスクされた動画パッチのピクセル値を予測することで、モデルは効果的な動画特徴表現を学習
Transformerアーキテクチャ
視覚Transformerアーキテクチャに基づき、動画パッチシーケンスを処理、動画時系列モデリングに適している

モデル能力

動画分類
動画特徴抽出

使用事例

動画理解
Kinetics-400動画分類
動画をKinetics-400データセットの400カテゴリに分類
Kinetics-400テストセットでtop-1精度80.9、top-5精度94.7を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase