C

CLIP Convnext Large D.laion2b S26b B102k Augreg

由 laion 开发
基于LAION-2B数据集训练的大规模ConvNeXt-Large CLIP模型,支持零样本图像分类和图文检索任务
下载量 80.74k
发布时间 : 1/29/2023

模型简介

该模型采用ConvNeXt-Large架构,通过增强数据增广与正则化技术训练,在ImageNet零样本分类任务中达到75.9%准确率

模型特点

ConvNeXt架构创新
首批大规模训练的ConvNeXt CLIP模型,相比传统ViT架构在计算效率上有显著提升
增强数据增广
采用随机缩放裁剪(RRC)、随机擦除(RE)、随机深度(SD)等先进正则化技术提升模型鲁棒性
高效训练
在256分辨率下仅用ViT-L/16一半的计算量即实现更高性能

模型能力

零样本图像分类
图文相似度计算
跨模态检索

使用案例

图像理解
零样本图像分类
无需微调即可对新图像进行分类
ImageNet-1k零样本准确率75.9%
跨模态检索
图文检索
根据文本搜索相关图像或根据图像生成描述
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase