V

Vit Base Patch32 Clip 224.laion2b E16

由 timm 开发
基于LAION-2B数据集训练的Vision Transformer模型,支持零样本图像分类任务
下载量 7,683
发布时间 : 10/23/2024

模型简介

这是一个双用途模型,可在OpenCLIP和timm框架中使用,主要用于零样本图像分类任务。

模型特点

双框架支持
同时兼容OpenCLIP和timm框架,提供灵活的使用方式
零样本学习
无需特定类别训练即可对新类别进行分类
大规模预训练
基于LAION-2B大规模数据集训练,具有强大的视觉理解能力

模型能力

零样本图像分类
图像特征提取
跨模态理解

使用案例

计算机视觉
图像分类
对图像进行分类而无需特定类别的训练数据
内容审核
识别图像中的不当内容
多模态应用
图文匹配
评估图像与文本描述的匹配程度
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase