videomae-base-finetuned-ucf101-subsetオープンソース動画分類モデル

ホーム

Videomae Base Finetuned Ucf101 Subset

burcusuによって開発

VideoMAEベースモデルをUCF101サブセットでファインチューニングしたビデオ分類モデル、精度95.22%達成

動画処理

Transformers

#ビデオ行動認識 #高精度 #UCF101ファインチューニング

ダウンロード数 17

リリース時間 : 1/15/2023

モデル概要

このモデルはVideoMAEアーキテクチャのビデオ理解モデルで、UCF101データセットのサブセットに特化してファインチューニングされており、ビデオ行動認識タスクに適しています

モデル特徴

高精度

UCF101サブセットで95.22%の分類精度を達成

自己教師あり事前学習ベース

VideoMAEアーキテクチャを採用し、マスクオートエンコーダーによる事前学習を実施

効率的なファインチューニング

ベースモデルに対して少数サンプルでファインチューニングし、特定タスクへの迅速な適応を実現

モデル能力

ビデオ行動認識

ビデオコンテンツ分類

時空間特徴抽出

使用事例

ビデオ分析

行動認識システム

ビデオ中の人体動作や行動を識別

UCF101サブセットで95.22%の精度を達成

ビデオコンテンツ分類

ビデオコンテンツを自動分類・タグ付け

トレーニング損失	エポック	ステップ	検証損失	正解率
1.0091	0.25	233	1.0615	0.6618
0.365	1.25	466	0.5371	0.8051
0.1671	2.25	699	0.3670	0.8897
0.0051	3.25	932	0.1527	0.9522

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Videomae Base Finetuned Ucf101 Subset

モデル概要

モデル特徴

モデル能力

使用事例

🚀 videomae-base-finetuned-ucf101-subset

🚀 クイックスタート

📄 ライセンス

🔧 技術詳細

トレーニングハイパーパラメータ

トレーニング結果

フレームワークバージョン