V

Videomae Base Finetuned Ssv2

MCG-NJUによって開発
VideoMAEはマスク自己符号化器(MAE)に基づく動画自己教師あり事前学習モデルで、Something-Something-v2データセットで動画分類タスク向けにファインチューニングされています。
ダウンロード数 951
リリース時間 : 8/2/2022

モデル概要

このモデルは自己教師あり方式で事前学習され、Something-Something-v2データセットで教師ありファインチューニングされており、主に動画分類タスクに使用されます。

モデル特徴

自己教師あり事前学習
マスク自己符号化器(MAE)手法を用いた動画自己教師あり事前学習により、注釈データへの依存を低減
効率的な動画表現学習
マスキングと再構築メカニズムを通じて動画の内部表現を学習し、効果的に動画特徴を抽出可能
Transformerアーキテクチャ
視覚Transformerアーキテクチャに基づき、動画を固定サイズブロック系列として処理

モデル能力

動画分類
動画特徴抽出

使用事例

動画理解
行動認識
動画中の人間の動作や行動を識別
Something-Something-v2テストセットで70.6% top-1精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase