M

Mexma Siglip2

由 visheratin 开发
MEXMA-SigLIP2是一个结合了MEXMA多语言文本编码器和SigLIP2图像编码器的高性能CLIP模型,支持80种语言。
下载量 224
发布时间 : 3/2/2025

模型简介

该模型结合了MEXMA多语言文本编码器和SigLIP2图像编码器,实现了跨模态检索功能,特别擅长零样本图像分类任务。

模型特点

多语言支持
支持80种语言,包括多种亚洲、欧洲和非洲语言
高性能跨模态检索
在Crossmodal-3600数据集上创造了新的最先进水平
零样本学习能力
无需特定任务的微调即可执行图像分类任务

模型能力

零样本图像分类
跨模态检索
多语言文本理解
图像-文本匹配

使用案例

图像检索
多语言图像搜索
使用不同语言查询检索相关图像
在Crossmodal-3600数据集上达到62.54%的图像检索准确率
文本检索
图像相关文本检索
根据图像内容检索相关文本描述
在Crossmodal-3600数据集上达到59.99%的文本检索准确率
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase