T

Timesformer Base Finetuned K600

Developed by facebook
TimeSformerはKinetics-600データセットで事前学習されたビデオ分類モデルで、時空間注意メカニズムを使用してビデオデータを処理します。
Downloads 4,026
Release Time : 10/7/2022

Model Overview

このモデルは主に、ビデオをKinetics-600データセットの600の可能なクラスのいずれかに分類するために使用され、Transformerアーキテクチャを使用してビデオの時空間的特徴を処理します。

Model Features

時空間注意メカニズム
Transformerアーキテクチャを使用して、ビデオの空間次元と時間次元の情報を同時に処理
大規模事前学習
600のアクションカテゴリを含むKinetics-600データセットで事前学習
エンドツーエンドのビデオ理解
手動で設計した特徴なしに、生のビデオフレームから直接時空間的特徴を学習

Model Capabilities

ビデオ分類
アクション認識
時空間特徴抽出

Use Cases

ビデオコンテンツ分析
アクション認識
ビデオ内の人物のアクションカテゴリを識別
Kinetics-600の600のアクションを識別可能
ビデオコンテンツ分類
ビデオコンテンツを自動分類
インテリジェント監視
異常行動検出
監視ビデオ内の異常行動を検出
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase