vivit-b-16x2-kinetics400 - UCF-Crimeオープンソース動画分類モデル

ホーム

Vivit B 16x2 Kinetics400 UCF Crime Finetuned AbnormalVideosOnly

Prabesh06によって開発

このモデルはViViTアーキテクチャに基づく動画分類モデルで、異常動画検出タスク向けに特別に微調整されています

動画処理

Transformers

オープンソースライセンス:MIT #動画異常検出 #暴力行為認識 #監視カメラ映像分析

ダウンロード数 15

リリース時間 : 1/11/2025

モデル概要

ViViTアーキテクチャに基づく動画理解モデルで、UCF-Crimeデータセットで微調整され、異常行動検出に特化しています

モデル特徴

動画異常検出

動画中の異常行動を検出・分類するために特別に設計されています

Transformerアーキテクチャベース

ViViTアーキテクチャを採用し、動画理解における視覚Transformerの利点を組み合わせています

事前学習-微調整パラダイム

Kinetics400で事前学習し、UCF-Crimeデータセットで微調整しています

モデル能力

動画分類

異常行動検出

時空間特徴抽出

使用事例

セキュリティ監視

監視カメラ映像の異常検出

監視カメラ映像中の異常行動やイベントを自動検出

評価セットでの精度は9.62%

動画分析

動画内容理解

動画内容を分析し異常シーンを識別

学習損失	エポック	ステップ	検証損失	正解率
2.5324	0.5050	102	2.6516	0.0739
2.4308	1.4950	202	2.6304	0.0962

属性	详情
モデルタイプ	vivit-b-16x2-kinetics400-UCF-Crime-finetuned-AbnormalVideosOnly
学習データ	不明

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Vivit B 16x2 Kinetics400 UCF Crime Finetuned AbnormalVideosOnly

モデル概要

モデル特徴

モデル能力

使用事例

🚀 vivit-b-16x2-kinetics400-UCF-Crime-finetuned-AbnormalVideosOnly

📚 ドキュメント

モデルの説明

想定用途と制限事項

学習と評価データ

学習手順

学習ハイパーパラメータ

学習結果

フレームワークのバージョン

📄 ライセンス