vit_large_patch14_clip_224.metaclip_2pt5b开源视觉模型

Home

Vit Large Patch14 Clip 224.metaclip 2pt5b

Developed by timm

基于MetaCLIP-2.5B数据集训练的双框架兼容视觉模型，支持零样本图像分类任务

图像分类

Safetensors

#零样本图像分类 #多框架兼容 #大规模预训练

Downloads 2,648

Release Time : 10/23/2024

Model Overview

该模型是基于Vision Transformer架构的大规模视觉模型，兼容open_clip和timm框架，主要用于零样本图像分类任务。

Model Features

双框架兼容

同时兼容open_clip和timm框架，提供更灵活的使用方式

大规模预训练

基于MetaCLIP-2.5B大规模数据集训练，具有强大的特征提取能力

零样本学习

支持零样本图像分类任务，无需特定类别训练即可进行分类

Model Capabilities

图像特征提取

零样本图像分类

跨模态理解

Use Cases

图像分类

开放域图像分类

对任意类别的图像进行分类而无需特定训练

内容理解

图像内容分析

提取图像中的高级语义特征

属性	详情
数据集	MetaCLIP - 2.5B

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Vit Large Patch14 Clip 224.metaclip 2pt5b

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 vit_large_patch14_clip_224.metaclip_2pt5b模型

🚀 快速开始

📚 详细文档

模型详情

📄 许可证