V

Videomae Small Finetuned Ssv2

MCG-NJUによって開発
VideoMAEはマスク自己符号化器(MAE)に基づくビデオ自己教師あり事前学習モデルで、Something-Something V2データセットでビデオ分類タスク用にファインチューニングされています。
ダウンロード数 140
リリース時間 : 4/16/2023

モデル概要

このモデルは自己教師あり方式で2400エポック事前学習され、Something-Something V2データセットで教師ありファインチューニングされ、ビデオを174のラベルのいずれかに分類できます。

モデル特徴

自己教師あり事前学習
マスク自己符号化器(MAE)手法を用いた自己教師あり事前学習により、ビデオ内部表現を効果的に学習
効率的なビデオ処理
ビデオを固定サイズのパッチシーケンスに処理し、Transformerアーキテクチャで効率的に処理
SSV2データセットファインチューニング
Something-Something V2データセットでファインチューニングされ、行動認識タスク専用

モデル能力

ビデオ分類
行動認識
特徴抽出

使用事例

ビデオ理解
行動認識
ビデオ中の人間の行動や振る舞いを認識
SSV2テストセットで66.8%のtop-1精度を達成
ビデオコンテンツ分析
ビデオコンテンツを分析し自動分類
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase