C

CLIP ViT G 14 Laion2b S34b B88k

由 laion 开发
基于LAION-2B数据集训练的CLIP ViT-g/14模型,支持零样本图像分类和图文检索任务
下载量 76.65k
发布时间 : 3/6/2023

模型简介

这是一个基于LAION-5B英语子集LAION-2B训练的CLIP ViT-g/14模型,使用OpenCLIP框架实现,主要用于零样本图像分类和图文检索等任务。

模型特点

大规模训练
使用LAION-2B数据集(20亿样本)进行训练,具有强大的泛化能力
零样本学习
无需特定任务微调即可执行图像分类和检索任务
高性能
在ImageNet-1k上达到78.4%的零样本top-1准确率

模型能力

零样本图像分类
图文检索
图像特征提取
文本特征提取

使用案例

计算机视觉
图像分类
无需训练即可对图像进行分类
在ImageNet-1k上达到78.4%准确率
图像搜索
基于文本描述搜索相关图像
研究
多模态学习研究
用于研究视觉-语言联合表示学习
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase