V

Vit L 16 HTxt Recap CLIP

由 UCSC-VLAA 开发
基于Recap-DataComp-1B数据集训练的CLIP模型,使用LLaMA-3生成的标注文本进行训练,适用于零样本图像分类任务
下载量 538
发布时间 : 6/13/2024

模型简介

对比式图文模型,通过重新标注的网络图片数据进行训练,具备强大的零样本图像分类能力

模型特点

LLaMA-3重新标注
使用LLaMA-3生成的标注文本对数十亿网络图片进行重新标注训练
大规模训练
基于Recap-DataComp-1B大规模数据集训练
零样本能力
无需微调即可直接应用于多种图像分类任务

模型能力

零样本图像分类
图文匹配
跨模态特征提取

使用案例

图像理解
图像分类
无需训练即可对图像进行分类
示例显示对'法式甜甜圈'图像分类准确率100%
内容审核
不当内容检测
识别图像中的不当内容
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase