resnet50_clip.cc12m开源模型 - 零样本图像分类，免费支持高效识别任务

Home

Resnet50 Clip.cc12m

Developed by timm

基于CC12M数据集训练的ResNet50架构CLIP模型，支持零样本图像分类任务

图像分类

Safetensors

Open Source License:MIT #零样本图像分类 #双框架兼容 #快速GELU激活

Downloads 233

Release Time : 10/23/2024

Model Overview

该模型是兼容open_clip和timm框架的双用途视觉语言模型，采用ResNet50架构和快速GELU激活函数，适用于零样本图像分类任务

Model Features

双框架兼容

同时支持open_clip和timm框架，提供更灵活的使用方式

快速GELU激活

采用quickgelu激活函数，可能提升模型训练和推理效率

零样本学习

支持零样本图像分类，无需针对特定任务进行微调

Model Capabilities

零样本图像分类

图像特征提取

跨模态理解

Use Cases

计算机视觉

图像分类

对未见过的图像类别进行分类

视觉搜索

基于文本描述检索相关图像

多模态应用

图文匹配

评估图像与文本描述的匹配程度

属性	详情
模型类型	零样本图像分类模型
训练数据	CC12M

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Resnet50 Clip.cc12m

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 resnet50_clip.cc12m模型卡片

🚀 快速开始

📚 详细文档

模型详情

📄 许可证