VideoMAEオープンソース動画分類モデル - 無料でデプロイし、商店の万引き行為を正確に検出

ホーム

Videomae Base Finetuned Kinetics Finetuned Dcsass Shoplifting Subset

Abdullah1によって開発

VideoMAEアーキテクチャに基づくビデオ分類モデル、店舗での窃盗行為検出用に微調整

動画処理

Transformers

#ビデオ行動認識 #窃盗行為検出 #高精度動作分類

ダウンロード数 23

リリース時間 : 5/1/2024

モデル概要

このモデルはVideoMAEアーキテクチャに基づくビデオ分類モデルで、Kineticsデータセットで事前学習された後、店舗窃盗検出シナリオ向けに微調整されています。

モデル特徴

効率的なビデオ理解

VideoMAEアーキテクチャを採用し、マスク付き自己符号化事前学習により効率的なビデオ特徴学習を実現

特定シナリオ最適化

店舗窃盗検出シナリオ向けに特別に微調整され、特定の行動認識精度を向上

軽量推論

基本版モデルは実際の展開シナリオに適し、性能と計算リソース需要のバランスを取る

モデル能力

ビデオ行動分類

異常行動検出

リアルタイムビデオ分析

使用事例

セキュリティ監視

店舗窃盗行為検出

監視カメラ映像をリアルタイム分析し、潜在的な窃盗行為を識別

検証セット精度88.74%

小売分析

顧客行動分析

店舗内の異常な顧客行動パターンを識別

学習損失	エポック	ステップ	検証損失	正解率
0.3314	0.2013	157	0.6146	0.8219
0.3263	1.2013	314	0.6184	0.8288
0.6332	2.2013	471	0.4275	0.8425
0.0405	3.2013	628	0.7687	0.8425
0.1579	4.1949	780	0.5852	0.8562

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Videomae Base Finetuned Kinetics Finetuned Dcsass Shoplifting Subset

モデル概要

モデル特徴

モデル能力

使用事例

🚀 videomae-base-finetuned-kinetics-finetuned-dcsass-shoplifting-subset

📚 ドキュメント

モデルの説明

想定される用途と制限

学習と評価データ

学習手順

学習ハイパーパラメータ

学習結果

フレームワークのバージョン

📄 ライセンス