Timesformer-base-finetuned-k400-finetuned-aslオープンソース動画分類モデル

ホーム

Timesformer Base Finetuned K400 Finetuned Asl

Krithiikによって開発

このモデルはfacebook/timesformer-base-finetuned-k400を微調整したビデオ分類モデルで、評価セットで96.25%の精度を達成しました。

動画処理

Transformers

#ビデオ動作認識 #高精度 #時系列モデリング

ダウンロード数 74

リリース時間 : 2/9/2024

モデル概要

TimeSformerアーキテクチャに基づくビデオ分類モデルで、動作認識タスクに適しています。

モデル特徴

高精度

評価セットで96.25%の精度を達成

TimeSformerアーキテクチャベース

時空間注意メカニズムを採用した先進的なビデオ処理アーキテクチャ

微調整バージョン

Kinetics-400事前学習モデルを基に微調整

モデル能力

ビデオ分類

動作認識

時空間特徴抽出

使用事例

ビデオ分析

手話認識

モデル名から推測するとアメリカ手話(ASL)認識に使用可能

精度96.25%

動作分類

ビデオ中の人間の動作を認識

トレーニング損失	エポック	ステップ	検証損失	正確度
0.3325	0.25	90	0.2077	0.9625
0.2898	1.25	180	0.1923	0.9375
0.3358	2.25	270	0.1170	0.95
0.3354	3.25	360	0.1142	0.9625

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Timesformer Base Finetuned K400 Finetuned Asl

モデル概要

モデル特徴

モデル能力

使用事例

🚀 timesformer-base-finetuned-k400-finetuned-asl

📚 ドキュメント

トレーニング手順

トレーニングハイパーパラメータ

トレーニング結果

フレームワークバージョン

📄 ライセンス