开源TimeSformer-hr-finetuned-k400模型 - 高效实现视频理解与分析

Home

Timesformer Hr Finetuned K400

Developed by facebook

TimeSformer是一种基于空间-时间注意力机制的视频理解模型，在Kinetics-400数据集上进行了预训练和微调。

视频处理

Transformers

#视频分类 #时空注意力 #高分辨率处理

Downloads 178

Release Time : 10/7/2022

Model Overview

该模型主要用于视频分类任务，能够将视频分类为400种可能的Kinetics-400标签之一。

Model Features

空间-时间注意力机制

采用纯注意力机制处理视频中的空间和时间信息，无需卷积操作。

高分辨率处理能力

该变体支持高分辨率视频输入，能够捕捉更精细的视觉特征。

大规模预训练

在Kinetics-400大规模视频数据集上进行预训练，具有强大的泛化能力。

Model Capabilities

视频分类

动作识别

视频内容分析

Use Cases

视频内容理解

动作识别

识别视频中的人类动作和行为

可识别400种不同的动作类别

视频分类

对视频内容进行分类和标注

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Timesformer Hr Finetuned K400

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 TimeSformer（高分辨率变体，在Kinetics - 400上微调）

🚀 快速开始

💻 使用示例

基础用法

📄 许可证

📚 详细文档

BibTeX引用和引用信息