finetuned-ViT-human-action-recognition-v1開源模型 - 精準實現人體動作圖像分類

Finetuned ViT Human Action Recognition V1

Developed by DrishtiSharma

基於Google Vision Transformer (ViT)在人體動作識別數據集上微調的圖像分類模型

Downloads 18

Release Time : 9/1/2022

Model Overview

該模型是基於Google的ViT-base-patch16-224-in21k預訓練模型，在Human_Action_Recognition數據集上進行微調，專門用於人體動作識別任務。

基於ViT架構

採用先進的Vision Transformer架構，能夠有效捕捉圖像中的全局關係

特定領域微調

在人體動作識別數據集上進行專門微調，優化了動作識別性能

遷移學習

利用預訓練模型的視覺特徵提取能力，通過微調適應特定任務

圖像分類

人體動作識別

視頻幀分析

智能監控

行為分析

監控視頻中的人體行為識別與分析

體育分析

運動員動作識別

識別和分析運動員的特定動作

人機交互

手勢識別

識別用戶的手勢動作進行交互