datatrain-videomae-base-finetunedオープンソース動画理解モデル - 未知のデータセットの動画分析に適用可能

ホーム

Datatrain Videomae Base Finetuned Lr1e 07 Poly3

EloiseInacioによって開発

MCG-NJU/videomae-baseをベースにファインチューニングした動画理解モデル、未知のデータセットで訓練、精度は11.1%

動画処理

Transformers

#動画理解 #低学習率ファインチューニング #多項式減衰

ダウンロード数 13

リリース時間 : 4/11/2025

モデル概要

このモデルはVideoMAEアーキテクチャに基づく動画理解モデルで、特定タスク向けにファインチューニングされており、動画コンテンツ分析タスクに適しています

モデル特徴

VideoMAEアーキテクチャベース

動画マスク自己符号化器(VideoMAE)アーキテクチャを採用し、動画理解タスクに適しています

特定タスク向けファインチューニング

ベースモデルに対して特定タスク向けのファインチューニングを実施

多項式学習率スケジューリング

訓練過程で多項式減衰学習率スケジューリング戦略を使用

モデル能力

動画コンテンツ分析

動画特徴抽出

使用事例

動画理解

動画分類

動画コンテンツを分類識別

現在の精度11.1%

学習損失	エポック	ステップ	検証損失	正解率
2.4435	0.5003	1549	2.4547	0.1003
2.3689	1.4997	3096	2.4541	0.1003

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Datatrain Videomae Base Finetuned Lr1e 07 Poly3

モデル概要

モデル特徴

モデル能力

使用事例

🚀 datatrain-videomae-base-finetuned-lr1e-07-poly3

🚀 クイックスタート

✨ 主な機能

📦 インストール

💻 使用例

📚 ドキュメント

モデルの説明

想定される用途と制限

学習と評価データ

🔧 技術詳細

学習手順

学習ハイパーパラメータ

学習結果

フレームワークのバージョン

📄 ライセンス