T

Timesformer Base Finetuned K400

onnx-communityによって開発
TimeSformerはTransformerベースのビデオ理解モデルで、Kinetics-400データセット向けに特別にファインチューニングされています。
ダウンロード数 17
リリース時間 : 8/9/2024

モデル概要

TimeSformerはビデオ分類用のTransformerモデルで、空間的注意と時間的注意を分離することで効率的にビデオデータを処理します。このバージョンはKinetics-400データセットでファインチューニングされたONNX重みバージョンで、Webデプロイに適しています。

モデル特徴

効率的なビデオ処理
分離された空間的・時間的注意機構を採用し、ビデオデータを効果的に処理
Web互換性
ONNX重みバージョンを提供し、Transformers.jsでWeb上で実行可能
事前学習とファインチューニング
Kinetics-400データセットでファインチューニングされており、ビデオ分類タスクに適している

モデル能力

ビデオ分類
ビデオ内容理解
行動認識

使用事例

ビデオ分析
行動認識
ビデオ中の人間の行動や振る舞いを認識
Kinetics-400データセットの400種類の行動カテゴリを正確に分類可能
コンテンツモデレーション
ビデオ中の不適切なコンテンツを自動検出
インテリジェント監視
異常行動検出
監視ビデオ中の異常な行動パターンを検出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase