T

Timesformer Base Finetuned Ssv2

由onnx-community開發
TimeSformer是一種基於Transformer的視頻理解模型,專門針對時序動作識別任務進行了優化。
下載量 17
發布時間 : 8/9/2024

模型概述

該模型是Facebook開發的TimeSformer架構的變體,專門在Something-Something V2數據集上進行了微調,適用於視頻動作識別任務。

模型特點

時空注意力機制
採用Transformer架構同時處理空間和時間維度信息,有效捕捉視頻中的時空特徵
高效視頻處理
相比傳統3D CNN模型,能以更高效的方式處理長視頻序列
ONNX兼容性
提供ONNX格式權重,便於在Web環境中部署使用

模型能力

視頻動作識別
時序行為理解
視頻內容分析

使用案例

智能視頻分析
動作識別系統
識別視頻中的人類動作和行為
可準確分類Something-Something V2數據集中的174類動作
視頻內容理解
分析視頻內容並提取關鍵動作信息
人機交互
手勢識別
識別視頻中的人類手勢和動作
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase