T

Timesformer Base Finetuned K600

facebookによって開発
TimeSformerはKinetics-600データセットで事前学習されたビデオ分類モデルで、時空間注意メカニズムを使用してビデオデータを処理します。
ダウンロード数 4,026
リリース時間 : 10/7/2022

モデル概要

このモデルは主に、ビデオをKinetics-600データセットの600の可能なクラスのいずれかに分類するために使用され、Transformerアーキテクチャを使用してビデオの時空間的特徴を処理します。

モデル特徴

時空間注意メカニズム
Transformerアーキテクチャを使用して、ビデオの空間次元と時間次元の情報を同時に処理
大規模事前学習
600のアクションカテゴリを含むKinetics-600データセットで事前学習
エンドツーエンドのビデオ理解
手動で設計した特徴なしに、生のビデオフレームから直接時空間的特徴を学習

モデル能力

ビデオ分類
アクション認識
時空間特徴抽出

使用事例

ビデオコンテンツ分析
アクション認識
ビデオ内の人物のアクションカテゴリを識別
Kinetics-600の600のアクションを識別可能
ビデオコンテンツ分類
ビデオコンテンツを自動分類
インテリジェント監視
異常行動検出
監視ビデオ内の異常行動を検出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase