convnext_base.clip_laion2b_augreg开源图像编码器

Home

Convnext Base.clip Laion2b Augreg

Developed by timm

基于CLIP框架的ConvNeXt Base图像编码器，使用LAION-2B数据集训练，支持图像特征提取

图像分类

Transformers

Open Source License:Apache-2.0 #多模态预训练 #零样本图像分类 #大规模视觉表征

Downloads 522

Release Time : 12/24/2024

Model Overview

该模型是CLIP框架中的图像编码器部分，采用ConvNeXt Base架构，通过LAION-2B数据集训练，能够高效提取图像特征，适用于视觉-语言任务。

Model Features

高效的图像特征提取

采用ConvNeXt Base架构，能够高效地从图像中提取有意义的特征

大规模数据集训练

使用LAION-2B数据集训练，具有强大的泛化能力

CLIP框架兼容

作为CLIP框架的图像编码器部分，可与文本编码器配合完成跨模态任务

Model Capabilities

图像特征提取

视觉表示学习

跨模态对齐

Use Cases

计算机视觉

图像检索

通过提取图像特征实现高效的图像检索

视觉-语言任务

作为CLIP框架的一部分，可用于图像-文本匹配等任务

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Convnext Base.clip Laion2b Augreg

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 convnext_base.clip_laion2b_augreg模型卡片

📄 许可证

标签