videomae-base-ssv2-finetuned-rwf2000オープンソースの動画理解モデル

ホーム

Videomae Base Ssv2 Finetuned Rwf2000

lmazzon70によって開発

VideoMAEアーキテクチャに基づくビデオ理解モデルで、RWF-2000データセットでファインチューニングされ、暴力行為検出タスクに使用されます

動画処理

Transformers

#ビデオ行動認識 #ファインチューニングモデル #時空間特徴抽出

ダウンロード数 30

リリース時間 : 1/9/2023

モデル概要

このモデルはVideoMAEアーキテクチャに基づくビデオ分類モデルで、特に暴力行為検出タスク向けにファインチューニングされています。ビデオコンテンツを分析し、その中の暴力行為を識別できます。

モデル特徴

ビデオ暴力行為検出

暴力行為検出タスクに最適化されたビデオ理解モデル

自己教師あり事前学習に基づく

VideoMAE自己教師あり事前学習アーキテクチャを使用し、優れたビデオ特徴抽出能力を有する

効率的なファインチューニング

RWF-2000データセットでファインチューニングされ、特定の暴力検出タスクに適応

モデル能力

ビデオコンテンツ分析

暴力行為識別

ビデオ分類

使用事例

公共安全

監視カメラ映像分析

監視カメラ映像中の暴力行為を自動分析

精度45.71%

コンテンツ審査

ビデオコンテンツフィルタリング

ユーザーアップロードの暴力コンテンツを自動識別・フィルタリング

学習損失	エポック	ステップ	検証損失	正解率
0.419	0.25	800	0.6122	0.76
1.2475	1.25	1600	1.4005	0.6038
0.0131	2.25	2400	1.2546	0.685
0.1379	3.25	3200	0.9228	0.7712

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Videomae Base Ssv2 Finetuned Rwf2000

モデル概要

モデル特徴

モデル能力

使用事例

🚀 videomae-base-ssv2-finetuned-rwf2000

📚 ドキュメント

モデルの説明

想定される用途と制限

学習と評価データ

🔧 技術詳細

学習手順

学習ハイパーパラメータ

学習結果

フレームワークバージョン

📄 ライセンス