M

Metaclip B16 400m

Developed by facebook
MetaCLIP是基于CommonCrawl数据训练的视觉-语言模型,用于构建图像-文本共享嵌入空间
Downloads 51
Release Time : 10/9/2023

Model Overview

该模型将MetaCLIP框架应用于CommonCrawl的4亿数据点,用于揭示CLIP训练数据筛选方法,支持图像与文本的跨模态理解

Model Features

公开数据训练
使用CommonCrawl公开数据集训练,数据透明度高
跨模态理解
可同时处理视觉和文本信息,建立共享嵌入空间
零样本学习
无需特定任务训练即可执行新任务

Model Capabilities

零样本图像分类
基于文本的图像检索
基于图像的文本检索
跨模态特征提取

Use Cases

内容检索
图像搜索引擎
使用自然语言描述检索相关图像
智能标注
自动图像标注
为未标注图像生成描述性标签
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase