V

Videomae Base Finetuned Signlanguage Last 3

ihsanahakiimによって開発
MCG - NJU/videomae - baseをベースに微調整された動画理解モデルで、手話認識タスクに特化しています。
ダウンロード数 21
リリース時間 : 3/4/2025

モデル概要

このモデルはVideoMAEアーキテクチャをベースに微調整されたバージョンで、手話認識タスクに特化しています。評価セットで72.81%の正確率を達成しています。

モデル特徴

動画理解能力
VideoMAEアーキテクチャをベースに、動画シーケンスから時空間特徴を抽出することに長けています。
手話認識最適化
手話認識タスクに特化して微調整され、評価セットで72.81%の正確率を達成しています。
効率的なトレーニング
線形学習率スケジューリングとウォームアップ戦略を採用し、トレーニングプロセスを最適化しています。

モデル能力

動画分類
手話認識
時空間特徴抽出

使用事例

バリアフリー技術
手話翻訳システム
手話動画をリアルタイムで文字または音声に変換します。
評価セットで72.81%の認識正確率を達成しています。
教育技術
手話学習支援
学習者の手話動作の正確性を評価します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase