T

Timesformer Hr Finetuned K600

由fcakyon開發
TimeSformer是一種基於時空注意力機制的視頻理解模型,高分辨率變體專門針對Kinetics-600數據集進行了微調。
下載量 22
發布時間 : 12/10/2022

模型概述

該模型主要用於視頻分類任務,支持Kinetics-600數據集的600種類別分類。採用純注意力機制處理視頻時空信息,無需卷積操作。

模型特點

純注意力機制
完全基於Transformer架構處理視頻數據,無需傳統卷積操作
高分辨率支持
專門優化的高分辨率變體,能處理更精細的視頻內容
時空建模
同時捕捉視頻中的空間和時間維度信息

模型能力

視頻內容分類
時空特徵提取
動作識別

使用案例

視頻分析
動作識別
識別視頻中的人類動作和行為
可識別Kinetics-600數據集中的600種動作類別
視頻內容分類
對視頻內容進行自動分類和標記
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase