F

Finetuned ViT Human Action Recognition V1

Developed by DrishtiSharma
基於Google Vision Transformer (ViT)在人體動作識別數據集上微調的圖像分類模型
Downloads 18
Release Time : 9/1/2022

Model Overview

該模型是基於Google的ViT-base-patch16-224-in21k預訓練模型,在Human_Action_Recognition數據集上進行微調,專門用於人體動作識別任務。

Model Features

基於ViT架構
採用先進的Vision Transformer架構,能夠有效捕捉圖像中的全局關係
特定領域微調
在人體動作識別數據集上進行專門微調,優化了動作識別性能
遷移學習
利用預訓練模型的視覺特徵提取能力,通過微調適應特定任務

Model Capabilities

圖像分類
人體動作識別
視頻幀分析

Use Cases

智能監控
行為分析
監控視頻中的人體行為識別與分析
體育分析
運動員動作識別
識別和分析運動員的特定動作
人機交互
手勢識別
識別用戶的手勢動作進行交互
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase