T

Timesformer Base Finetuned Ssv2

由fcakyon開發
TimeSformer是一個基於時空注意力機制的視覺Transformer模型,專門用於視頻分類任務。
下載量 15
發布時間 : 12/10/2022

模型概述

該模型在Something Something v2數據集上進行了微調,能夠將視頻分類為174種可能的類別。它採用了純注意力機制來處理視頻中的時空信息。

模型特點

純注意力機制
完全基於注意力機制處理視頻中的時空信息,無需卷積操作
高效視頻理解
能夠有效捕捉視頻中的時空特徵,適用於動作識別等任務
Transformer架構
採用Transformer架構,具有良好的可擴展性和並行處理能力

模型能力

視頻分類
動作識別
時空特徵提取

使用案例

視頻理解
動作識別
識別視頻中的人類動作和行為
可在Something Something v2數據集上實現準確的分類
視頻內容分析
分析視頻內容並自動分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase