C

Clip4clip Webvid150k

Searchium-aiによって開発
WebVidデータセットのサブセットでトレーニングされたCLIP4Clipビデオ-テキスト検索モデル、大規模なビデオ-テキスト検索アプリケーション向け
ダウンロード数 19.30k
リリース時間 : 4/17/2023

モデル概要

このモデルはCLIP画像-言語事前トレーニングモデルの力を活用し、ビデオ内の視覚-時間概念を学習し、ビデオベースの検索を改善します。トレーニングにはWebVidデータセットの最初の15万のビデオ-テキストペアのサブセットが使用されました。

モデル特徴

大規模ビデオ検索
膨大なビデオデータセットを処理可能で、大規模なビデオ検索アプリケーションに適しています
CLIP4Clipアーキテクチャ
CLIP画像-言語事前トレーニングモデルに基づき、ビデオ検索タスク向けに最適化されています
WebVidデータセットトレーニング
大規模で多様なWebVidデータセットでトレーニングされ、モデルの性能を向上させます

モデル能力

ビデオ-テキスト検索
ビデオ埋め込み抽出
テキスト埋め込み抽出
クロスモーダル検索

使用事例

ビデオ検索
大規模ビデオライブラリ検索
約150万のビデオを含むコレクションから関連ビデオを検索
モデルが膨大なビデオデータセットを処理する可能性を示しています
コンテンツ管理
ビデオコンテンツのタグ付けと検索
テキスト記述に基づいて関連ビデオコンテンツを自動検索
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase