V

Videomae Base Finetuned Signlanguage Last 3

由ihsanahakiim開發
基於MCG-NJU/videomae-base微調的視頻理解模型,專注於手語識別任務
下載量 21
發布時間 : 3/4/2025

模型概述

該模型是基於VideoMAE架構微調的版本,專門用於手語識別任務。在評估集上達到了72.81%的準確率。

模型特點

視頻理解能力
基於VideoMAE架構,擅長從視頻序列中提取時空特徵
手語識別優化
專門針對手語識別任務進行微調,在評估集上達到72.81%準確率
高效訓練
採用線性學習率調度和預熱策略,優化訓練過程

模型能力

視頻分類
手語識別
時空特徵提取

使用案例

無障礙技術
手語翻譯系統
將手語視頻即時轉換為文字或語音
在評估集上達到72.81%的識別準確率
教育技術
手語學習輔助
評估學習者手語動作的準確性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase