TimeSformerオープンソースビデオ理解モデル - 無料でデプロイして簡単にビデオ分類タスクをこなせます

ホーム

Timesformer Base Finetuned K600

onnx-communityによって開発

TimeSformerはTransformerアーキテクチャに基づくビデオ理解モデルで、ビデオ分類タスクに特化しています。

動画処理

Transformers

#ビデオ行動認識 #時空間アテンション #ウェブ対応

ダウンロード数 16

リリース時間 : 8/9/2024

モデル概要

このモデルはTransformerアーキテクチャに基づくビデオ分類モデルで、Kinetics-600データセットでファインチューニングされており、ビデオ行動認識タスクに適しています。

モデル特徴

Transformerベースのビデオ理解

Transformerアーキテクチャを利用してビデオシーケンスを処理し、時空間的特徴を効果的に捕捉します。

Kinetics-600ファインチューニング

大規模なビデオデータセットKinetics-600でファインチューニングされており、優れたビデオ行動認識能力を持っています。

ONNX互換

ONNXフォーマットの重みを提供しており、ウェブ上でTransformers.jsを使用した展開が容易です。

モデル能力

ビデオ分類

行動認識

時空間特徴抽出

使用事例

ビデオ分析

行動認識

ビデオ中の人物の行動タイプ（走る、踊るなど）を識別します。

行動分析

監視やスポーツ分析のため、ビデオ中の行動パターンを分析します。

属性	详情
ベースモデル	facebook/timesformer-base-finetuned-k600
ライブラリ名	transformers.js

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Timesformer Base Finetuned K600

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Facebook/Timesformer - Base - Finetuned - K600 モデル

🚀 クイックスタート