videomae-base-finetunedオープンソース動画理解モデル - 無料デプロイで効率的な動画理解をサポート

ホーム

Videomae Base Finetuned

sheraz179によって開発

MCG-NJU/videomae-baseを未知のデータセットでファインチューニングした動画理解モデルで、F1スコアは0.7147を達成

動画処理

Transformers

#動画理解 #行動認識 #ファインチューニングモデル

ダウンロード数 15

リリース時間 : 2/8/2023

モデル概要

このモデルはVideoMAE基本アーキテクチャのファインチューニング版で、動画コンテンツ理解タスクに特化しており、動画分類や行動認識などのシナリオに適用可能

モデル特徴

効率的な動画表現学習

VideoMAEアーキテクチャに基づき、マスク付き自己符号化事前学習を通じて動画の時空間的特徴を効果的に学習

優れたファインチューニング性能

評価セットで0.7147のF1スコアを達成し、モデルに強い識別能力があることを示す

軽量トレーニング

小さなバッチサイズ(3)を使用して効率的にファインチューニング

モデル能力

動画特徴抽出

動画コンテンツ理解

時空間パターン認識

使用事例

動画分析

行動認識

動画中の人間の行動や活動を識別

F1スコア0.7147

動画分類

動画コンテンツを分類してラベル付け

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Videomae Base Finetuned

モデル概要

モデル特徴

モデル能力

使用事例

🚀 videomae-base-finetuned

📚 ドキュメント

モデルの説明

想定される用途と制限

学習と評価データ

学習手順

学習ハイパーパラメータ

学習結果

フレームワークのバージョン

📄 ライセンス