C

CLIP ViT G 14 Laion2b S34b B88k

Developed by laion
基于LAION-2B数据集训练的CLIP ViT-g/14模型,支持零样本图像分类和图文检索任务
Downloads 76.65k
Release Time : 3/6/2023

Model Overview

这是一个基于LAION-5B英语子集LAION-2B训练的CLIP ViT-g/14模型,使用OpenCLIP框架实现,主要用于零样本图像分类和图文检索等任务。

Model Features

大规模训练
使用LAION-2B数据集(20亿样本)进行训练,具有强大的泛化能力
零样本学习
无需特定任务微调即可执行图像分类和检索任务
高性能
在ImageNet-1k上达到78.4%的零样本top-1准确率

Model Capabilities

零样本图像分类
图文检索
图像特征提取
文本特征提取

Use Cases

计算机视觉
图像分类
无需训练即可对图像进行分类
在ImageNet-1k上达到78.4%准确率
图像搜索
基于文本描述搜索相关图像
研究
多模态学习研究
用于研究视觉-语言联合表示学习
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase