C

CLIP Convnext Large D 320.laion2B S29b B131k Ft Soup

由 laion 开发
基于ConvNeXt-Large架构的CLIP模型,在LAION-2B数据集上训练,支持零样本图像分类和图像文本检索任务
下载量 83.56k
发布时间 : 2/11/2023

模型简介

这是一个基于ConvNeXt-Large架构的CLIP模型,采用OpenCLIP框架在LAION-2B数据集上训练而成。模型支持零样本图像分类和图像文本检索等任务,具有较高的图像理解能力。

模型特点

高分辨率处理能力
支持320x320分辨率输入,相比标准256x256模型有更好的细节处理能力
权重平均优化
采用多次微调权重平均(soup)技术,提升了模型性能
高效架构设计
ConvNeXt-Large-D架构在320x320分辨率下比类似模型更高效

模型能力

零样本图像分类
图像文本检索
跨模态理解
图像特征提取

使用案例

图像分类
零样本图像分类
无需特定训练即可对图像进行分类
在ImageNet-1k上达到76.9%的零样本Top-1准确率
信息检索
图像文本检索
根据文本查询检索相关图像或根据图像检索相关文本
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase