T

Timesformer Hr Finetuned K600

facebookによって開発
TimeSformerは、空間-時間注意メカニズムに基づくビデオ分類モデルで、ビデオ理解タスク専用に設計されています。
ダウンロード数 2,927
リリース時間 : 10/7/2022

モデル概要

このモデルはKinetics-600データセットで事前学習されており、ビデオを600の可能なカテゴリに分類できます。畳み込み操作なしで、純粋な注意メカニズムを使用してビデオデータを処理します。

モデル特徴

純粋な注意メカニズム
完全にTransformerアーキテクチャに基づいており、従来の畳み込み操作なしで空間-時間注意を使用してビデオデータを処理します
効率的なビデオ理解
ビデオシーケンスデータを処理するために特別に設計されており、時空間特徴を捉えることができます
大規模事前学習
Kinetics-600大規模ビデオデータセットで事前学習されており、幅広い応用能力を持っています

モデル能力

ビデオ分類
時空間特徴抽出
ビデオ内容理解

使用事例

ビデオ分析
行動認識
ビデオ内の人間の行動や動作を識別します
Kinetics-600データセットの600の行動カテゴリを識別可能
ビデオ内容分類
ビデオ内容を自動的に分類しタグ付けします
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase