T

Timesformer Base Finetuned K600

onnx-communityによって開発
TimeSformerはTransformerアーキテクチャに基づくビデオ理解モデルで、ビデオ分類タスクに特化しています。
ダウンロード数 16
リリース時間 : 8/9/2024

モデル概要

このモデルはTransformerアーキテクチャに基づくビデオ分類モデルで、Kinetics-600データセットでファインチューニングされており、ビデオ行動認識タスクに適しています。

モデル特徴

Transformerベースのビデオ理解
Transformerアーキテクチャを利用してビデオシーケンスを処理し、時空間的特徴を効果的に捕捉します。
Kinetics-600ファインチューニング
大規模なビデオデータセットKinetics-600でファインチューニングされており、優れたビデオ行動認識能力を持っています。
ONNX互換
ONNXフォーマットの重みを提供しており、ウェブ上でTransformers.jsを使用した展開が容易です。

モデル能力

ビデオ分類
行動認識
時空間特徴抽出

使用事例

ビデオ分析
行動認識
ビデオ中の人物の行動タイプ(走る、踊るなど)を識別します。
行動分析
監視やスポーツ分析のため、ビデオ中の行動パターンを分析します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase