V

Videomae Large Finetuned Kinetics

MCG-NJUによって開発
VideoMAEはマスク自己符号化器に基づく自己教師あり動画事前学習モデルで、Kinetics-400データセットでファインチューニング後、動画分類タスクに使用可能です。
ダウンロード数 4,657
リリース時間 : 8/2/2022

モデル概要

このモデルは自己教師あり方式で事前学習され、Kinetics-400で教師ありファインチューニングされており、動画を400種類の可能なカテゴリに分類できます。

モデル特徴

自己教師あり事前学習
マスク自己符号化器(MAE)手法を用いた動画自己教師あり事前学習で、データ効率が高い
動画理解能力が高い
Kinetics-400データセットでファインチューニング後、優れた動画分類能力を発揮
Transformerアーキテクチャ
視覚Transformerアーキテクチャに基づき、動画シーケンスデータを効果的に処理可能

モデル能力

動画分類
動画特徴抽出
動画内容理解

使用事例

動画内容分析
動画分類
動画を400種類のKinetics-400カテゴリのいずれかに分類
Kinetics-400テストセットで84.7%のtop-1精度を達成
動画内容理解
動画の高レベルな特徴表現を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase