T

Timesformer Base Finetuned K400

由 onnx-community 开发
TimeSformer 是一个基于 Transformer 的视频理解模型,专门针对 Kinetics-400 数据集进行了微调。
下载量 17
发布时间 : 8/9/2024

模型简介

TimeSformer 是一个用于视频分类的 Transformer 模型,通过将空间和时间注意力分离来高效处理视频数据。该版本是在 Kinetics-400 数据集上微调的 ONNX 权重版本,适用于网页端部署。

模型特点

高效视频处理
采用分离的空间和时间注意力机制,有效处理视频数据
网页端兼容
提供 ONNX 权重版本,可通过 Transformers.js 在网页端运行
预训练微调
在 Kinetics-400 数据集上进行了微调,适用于视频分类任务

模型能力

视频分类
视频内容理解
动作识别

使用案例

视频分析
动作识别
识别视频中的人类动作和行为
可准确分类 Kinetics-400 数据集中的400种动作类别
内容审核
自动检测视频中的不当内容
智能监控
异常行为检测
监控视频中出现的异常行为模式
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase