V

Vit Large Patch14 Clip 224.metaclip 400m

由 timm 开发
基于MetaCLIP-400M数据集训练的视觉变换器模型,支持零样本图像分类任务
下载量 294
发布时间 : 10/23/2024

模型简介

这是一个双重用途的视觉变换器模型,兼容open_clip和timm框架,主要用于零样本图像分类任务

模型特点

双重框架兼容
同时支持open_clip和timm框架,提供更灵活的使用方式
零样本学习能力
无需特定类别训练即可进行分类,具有强大的泛化能力
大规模预训练
基于MetaCLIP-400M数据集训练,具有丰富的视觉概念理解能力

模型能力

零样本图像分类
视觉特征提取
跨模态理解

使用案例

图像理解
开放域图像分类
对任意类别的图像进行分类而无需特定训练
视觉内容分析
提取图像中的高级语义特征
多模态应用
图文匹配
评估图像与文本描述的匹配程度
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase