F

Finetuned ViT Human Action Recognition V1

由DrishtiSharma開發
基於Google Vision Transformer (ViT)在人體動作識別數據集上微調的圖像分類模型
下載量 18
發布時間 : 9/1/2022

模型概述

該模型是基於Google的ViT-base-patch16-224-in21k預訓練模型,在Human_Action_Recognition數據集上進行微調,專門用於人體動作識別任務。

模型特點

基於ViT架構
採用先進的Vision Transformer架構,能夠有效捕捉圖像中的全局關係
特定領域微調
在人體動作識別數據集上進行專門微調,優化了動作識別性能
遷移學習
利用預訓練模型的視覺特徵提取能力,通過微調適應特定任務

模型能力

圖像分類
人體動作識別
視頻幀分析

使用案例

智能監控
行為分析
監控視頻中的人體行為識別與分析
體育分析
運動員動作識別
識別和分析運動員的特定動作
人機交互
手勢識別
識別用戶的手勢動作進行交互
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase