TimeSformer視頻分類模型開源 - 針對Kinetics-400微調精準分類視頻

Home

Timesformer Base Finetuned K400

Developed by fcakyon

TimeSformer是一個基於空間-時間注意力機制的視頻分類模型，專門針對Kinetics-400數據集進行微調。

視頻處理

Transformers

#視頻動作識別 #時空注意力機制 #Kinetics-400預訓練

Downloads 17

Release Time : 12/10/2022

Model Overview

該模型用於將視頻分類為400種可能的Kinetics-400標籤之一，採用純注意力機制處理視頻數據，無需卷積操作。

Model Features

純注意力機制

完全基於空間-時間注意力機制處理視頻，無需傳統卷積操作

高效視頻理解

通過分解空間和時間注意力機制，實現對長視頻序列的高效處理

大規模預訓練

基於Kinetics-400大規模視頻數據集進行預訓練和微調

Model Capabilities

視頻分類

時空特徵提取

動作識別

Use Cases

視頻內容分析

動作識別

識別視頻中的人類動作和行為

可識別400種不同的動作類別

視頻內容分類

對視頻內容進行自動分類和標記

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Timesformer Base Finetuned K400

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 TimeSformer（基礎大小模型，在Kinetics - 400上微調）

🚀 快速開始

💻 使用示例

基礎用法

📚 詳細文檔

BibTeX引用和引用信息

📄 許可證