videomae-base-finetuned-ucf-crimevbinary-balancedv6オープンソース動画分析モデル

Videomae Base Finetuned Ucf Crimevbinary Balancedv6

shahadalllによって開発

MCG-NJU/videomae-baseをファインチューニングした動画分析モデルで、異常行動検知タスクに特化

ダウンロード数 133

リリース時間 : 1/8/2025

モデル概要

このモデルはVideoMAEアーキテクチャに基づく動画理解モデルで、ファインチューニングにより動画異常検知タスクに使用可能。評価セットで高い精度(84.75%)とAUC値(0.9263)を示す。

高精度異常検知

評価セットで84.75%の精度と0.9263のAUC値を達成し、優れた異常検知能力を示す

VideoMAEアーキテクチャ採用

効率的な動画マスク自己符号化事前学習手法を採用し、動画の時空間的特徴を効果的に学習可能

バランス訓練

モデル名の'balancedv6'はバランス訓練戦略を採用し、クラス不均衡問題に対処した可能性を示す

動画コンテンツ分析

異常行動検知

時空間特徴抽出

公共安全

監視カメラ映像分析

監視カメラ映像中の異常または不審な行動を自動検出

84.75%の異常イベントを識別可能

インテリジェント小売

店舗異常行動検知

店舗内の窃盗、暴力などの異常行動を検出

このモデルは、MCG-NJU/videomae-base を未知のデータセットでファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。

このモデルは、特定のビデオデータセットに対してファインチューニングされており、評価セットで良好な性能を示しています。以下に、モデルのトレーニングと評価に関する詳細を示します。

詳細情報は後日追加予定です。

詳細情報は後日追加予定です。

詳細情報は後日追加予定です。

トレーニング中に使用されたハイパーパラメータは以下の通りです。

学習率: 3e-05
トレーニングバッチサイズ: 8
評価バッチサイズ: 8
シード: 42
オプティマイザ: betas=(0.9,0.999) と epsilon=1e-08 の adamw_torch を使用。追加のオプティマイザ引数はありません。
学習率スケジューラの種類: 線形
学習率スケジューラのウォームアップステップ: 500
エポック数: 30

トレーニング損失	エポック	ステップ	検証損失	正解率	適合率	再現率	AUC
0.5676	1.0	165	0.5685	0.6608	0.6975	0.6608	0.8059
0.5645	2.0	330	0.3607	0.8481	0.8509	0.8481	0.9362
0.4638	3.0	495	0.5746	0.8021	0.8226	0.8021	0.8919
0.5765	4.0	660	0.3634	0.8622	0.8626	0.8622	0.9262
0.4146	5.0	825	0.5092	0.8092	0.8302	0.8092	0.9225
0.4319	6.0	990	0.4897	0.8799	0.8811	0.8799	0.9316
0.3396	7.0	1155	0.5233	0.8587	0.8599	0.8587	0.9257
0.1152	8.0	1320	0.6568	0.8763	0.8767	0.8763	0.9190
0.0578	9.0	1485	0.6344	0.8693	0.8716	0.8693	0.9321
0.0029	10.0	1650	0.7321	0.8728	0.8739	0.8728	0.9280
0.1363	11.0	1815	0.7399	0.8622	0.8636	0.8622	0.9215