T

Timesformer Hr Finetuned K600

Developed by facebook
TimeSformerは、空間-時間注意メカニズムに基づくビデオ分類モデルで、ビデオ理解タスク専用に設計されています。
Downloads 2,927
Release Time : 10/7/2022

Model Overview

このモデルはKinetics-600データセットで事前学習されており、ビデオを600の可能なカテゴリに分類できます。畳み込み操作なしで、純粋な注意メカニズムを使用してビデオデータを処理します。

Model Features

純粋な注意メカニズム
完全にTransformerアーキテクチャに基づいており、従来の畳み込み操作なしで空間-時間注意を使用してビデオデータを処理します
効率的なビデオ理解
ビデオシーケンスデータを処理するために特別に設計されており、時空間特徴を捉えることができます
大規模事前学習
Kinetics-600大規模ビデオデータセットで事前学習されており、幅広い応用能力を持っています

Model Capabilities

ビデオ分類
時空間特徴抽出
ビデオ内容理解

Use Cases

ビデオ分析
行動認識
ビデオ内の人間の行動や動作を識別します
Kinetics-600データセットの600の行動カテゴリを識別可能
ビデオ内容分類
ビデオ内容を自動的に分類しタグ付けします
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase