V

Videomae Base Short Ssv2

MCG-NJUによって開発
VideoMAEはマスク自己符号化器(MAE)に基づくビデオ自己教師あり事前学習モデルで、Something-Something-v2データセットで800エポックの事前学習を行いました。
ダウンロード数 112
リリース時間 : 8/2/2022

モデル概要

このモデルは自己教師あり方式でビデオ内部表現を学習し、主にビデオ分類などの下流タスクのファインチューニングに使用されます。

モデル特徴

ビデオ自己教師あり学習
マスク自己符号化器(MAE)手法を用いてビデオ自己教師あり事前学習を実施、ラベルデータ不要
効率的な事前学習
Something-Something-v2データセットで800エポックの事前学習を行い、ビデオ内部表現を学習
下流タスク適応
事前学習モデルはファインチューニングにより様々なビデオ理解タスクに適応可能

モデル能力

ビデオ特徴抽出
自己教師あり学習
ビデオ表現学習

使用事例

ビデオ理解
ビデオ分類
事前学習モデルを基にファインチューニングし、ビデオ内容分類に使用
行動認識
ビデオ中の人間の行動認識タスクに使用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase