V

Videomae Base Ipm All Videos

rickyskによって開発
VideoMAEベースモデルを未知の動画データセットでファインチューニングした視覚モデルで、主に動画理解タスクに使用され、評価セットで85.59%の精度を達成しました。
ダウンロード数 30
リリース時間 : 6/2/2023

モデル概要

このモデルはVideoMAEベースモデルのファインチューニング版で、動画コンテンツ分析タスクに特化しています。自己教師あり事前学習と下流タスクのファインチューニングにより、動画中の時空間的特徴を効果的に捉えることができます。

モデル特徴

効率的な動画特徴抽出
マスク自己符号化事前学習戦略を採用し、動画の時空間表現を効果的に学習可能
強力な転移学習能力
大規模事前学習モデルを基にファインチューニングし、特定の動画分析タスクに適応
バランスの取れた性能
評価セットで85.59%の精度、損失値0.4713を達成

モデル能力

動画コンテンツ理解
動画分類
時空間特徴抽出

使用事例

動画分析
動画コンテンツ分類
動画クリップを自動的に分類・識別
評価精度85.59%
行動認識
動画中の人間の行動や活動を識別
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase