xclip-base-patch16-ucf-8-shot开源模型 - 通用视频语言理解，适用多种视频任务

Home

Xclip Base Patch16 Ucf 8 Shot

Developed by microsoft

X-CLIP是CLIP的极简扩展，用于通用视频语言理解，以对比方式在（视频，文本）对上训练，适用于零样本、少样本或全监督视频分类以及视频-文本检索等任务。

视频处理

Transformers

EnglishOpen Source License:MIT #视频分类 #少样本学习 #对比学习

Downloads 16

Release Time : 9/7/2022

Model Overview

X-CLIP模型（基础尺寸，16x16的补丁分辨率）以少样本方式（K=8）在UCF101上训练，适用于视频分类任务。

Model Features

少样本学习

该模型在UCF101数据集上以少样本方式（K=8）训练，适用于数据量有限的应用场景。

视频-文本对比学习

模型以对比方式在（视频，文本）对上训练，支持视频-文本检索任务。

高准确率

在UCF101数据集上，模型的前1准确率达到88.3%。

Model Capabilities

视频分类

视频-文本检索

少样本学习

Use Cases

视频理解

视频分类

对视频内容进行分类，适用于视频内容分析和管理。

在UCF101数据集上达到88.3%的前1准确率。

视频-文本检索

根据文本描述检索相关视频内容，适用于视频搜索和推荐系统。

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Xclip Base Patch16 Ucf 8 Shot

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 X-CLIP（基础尺寸模型）

🚀 快速开始

✨ 主要特性

📦 安装指南

💻 使用示例

📚 详细文档

模型描述

预期用途和限制

训练数据

预处理

评估结果

🔧 技术细节

📄 许可证