X

Xclip Base Patch16 Hmdb 8 Shot

microsoftによって開発
X-CLIPはCLIPの拡張版で、ビデオと言語の汎用的な理解のために、ビデオとテキストのペアで対照学習を行い、ビデオ分類やビデオ-テキスト検索タスクに適しています。
ダウンロード数 17
リリース時間 : 9/7/2022

モデル概要

X-CLIP基本サイズモデルはHMDB-51データセットで少数ショット方式で訓練され、ビデオ分類とビデオ-テキスト検索タスクをサポートします。

モデル特徴

少数ショット学習
モデルはHMDB-51データセットで8ショット方式で訓練され、少数ショットシナリオに適しています。
ビデオ-言語理解
ビデオとテキストのペアで対照学習を行い、ビデオとテキストのマッチングタスクをサポートします。
高解像度処理
訓練時には各ビデオクリップに32フレーム、解像度224x224を使用し、高解像度ビデオ分析に適しています。

モデル能力

ビデオ分類
ビデオ-テキスト検索
少数ショット学習

使用事例

ビデオ分析
アクション認識
ビデオ中の特定のアクション(走る、跳ぶなど)を識別します。
HMDB-51データセットで62.8%のtop-1精度を達成。
ビデオ-テキストマッチング
ビデオ検索
テキスト記述に基づいて関連ビデオクリップを検索します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase