C

CLIP ViT L Rho50 K1 Constrained FARE2

由 LEAF-CLIP 开发
基于openai/clip-vit-large-patch14微调的特征提取模型,优化了图像和文本编码器
下载量 253
发布时间 : 4/16/2025

模型简介

这是一个基于CLIP架构的特征提取模型,通过FARE和LEAF方法对图像和文本编码器进行了微调,适用于多模态特征提取任务。

模型特点

对抗性微调
图像编码器使用FARE在ε=2/255下进行微调,增强了对抗性攻击的鲁棒性
语义约束微调
文本编码器使用LEAF在k=1、ρ=50并带有语义约束的条件下进行微调
多模态特征提取
同时支持图像和文本特征提取,保持原始CLIP的多模态能力

模型能力

图像特征提取
文本特征提取
多模态特征对齐

使用案例

计算机视觉
图像检索
使用提取的图像特征进行相似图像检索
自然语言处理
跨模态检索
实现文本到图像或图像到文本的跨模态检索
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase