C

Clip4clip Webvid150k

由Searchium-ai開發
基於WebVid數據集子集訓練的CLIP4Clip視頻-文本檢索模型,用於大規模視頻-文本檢索應用
下載量 19.30k
發布時間 : 4/17/2023

模型概述

該模型利用CLIP圖像-語言預訓練模型的力量,學習視頻中的視覺-時間概念,改進基於視頻的搜索。訓練使用了WebVid數據集前15萬個視頻-文本對的子集。

模型特點

大規模視頻檢索
能夠處理海量視頻數據集,適用於大規模視頻搜索應用
CLIP4Clip架構
基於CLIP圖像-語言預訓練模型,專門針對視頻檢索任務優化
WebVid數據集訓練
使用大規模多樣化的WebVid數據集訓練,提升模型性能

模型能力

視頻-文本檢索
視頻嵌入提取
文本嵌入提取
跨模態搜索

使用案例

視頻搜索
大規模視頻庫檢索
在包含約150萬視頻的集合中搜索相關視頻
演示了模型處理海量視頻數據集的潛力
內容管理
視頻內容標註與檢索
根據文本描述自動檢索相關視頻內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase