C

Clip4clip Webvid150k

由 Searchium-ai 开发
基于WebVid数据集子集训练的CLIP4Clip视频-文本检索模型,用于大规模视频-文本检索应用
下载量 19.30k
发布时间 : 4/17/2023

模型简介

该模型利用CLIP图像-语言预训练模型的力量,学习视频中的视觉-时间概念,改进基于视频的搜索。训练使用了WebVid数据集前15万个视频-文本对的子集。

模型特点

大规模视频检索
能够处理海量视频数据集,适用于大规模视频搜索应用
CLIP4Clip架构
基于CLIP图像-语言预训练模型,专门针对视频检索任务优化
WebVid数据集训练
使用大规模多样化的WebVid数据集训练,提升模型性能

模型能力

视频-文本检索
视频嵌入提取
文本嵌入提取
跨模态搜索

使用案例

视频搜索
大规模视频库检索
在包含约150万视频的集合中搜索相关视频
演示了模型处理海量视频数据集的潜力
内容管理
视频内容标注与检索
根据文本描述自动检索相关视频内容
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase