TimeSformer - HRオープンソースビデオアクション認識モデル - Kinetics

ホーム

Timesformer Hr Finetuned K400

onnx-communityによって開発

TimeSformer-HRは、ビデオベースの高解像度時空間Transformerモデルで、Kinetics-400データセットでファインチューニングされており、ビデオ行動認識タスクに適しています。

動画処理

Transformers

#ビデオ行動認識 #HR時空間モデリング #ウェブデプロイ

ダウンロード数 17

リリース時間 : 8/9/2024

モデル概要

このモデルはTransformerアーキテクチャを使用してビデオデータを処理し、時空間特徴の抽出に焦点を当て、ビデオ内の複雑な行動を認識できます。

モデル特徴

高解像度処理

高解像度ビデオ入力をサポートし、より詳細な時空間特徴を捕捉可能

時空間注意メカニズム

Transformerアーキテクチャを使用して時間と空間の次元情報を同時に処理

事前学習-ファインチューニングパラダイム

Kinetics-400大規模ビデオデータセットでファインチューニングされており、優れた転移学習能力を有する

モデル能力

ビデオ行動認識

時空間特徴抽出

高解像度ビデオ処理

使用事例

ビデオ分析

行動認識システム

ビデオ内の人間の行動や動作を認識

Kinetics-400データセットの400種類の行動カテゴリを認識可能

ビデオコンテンツ理解

ビデオコンテンツを分析し、主要な行動情報を抽出

インテリジェント監視

異常行動検出

監視カメラビデオ内の異常な動作や行動を検出

属性	详情
ベースモデル	facebook/timesformer-hr-finetuned-k400
ライブラリ名	transformers.js

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Timesformer Hr Finetuned K400

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Facebook Timesformer-HR モデルのONNX版

🚀 クイックスタート