M

Mexma Siglip2

由visheratin開發
MEXMA-SigLIP2是一個結合了MEXMA多語言文本編碼器和SigLIP2圖像編碼器的高性能CLIP模型,支持80種語言。
下載量 224
發布時間 : 3/2/2025

模型概述

該模型結合了MEXMA多語言文本編碼器和SigLIP2圖像編碼器,實現了跨模態檢索功能,特別擅長零樣本圖像分類任務。

模型特點

多語言支持
支持80種語言,包括多種亞洲、歐洲和非洲語言
高性能跨模態檢索
在Crossmodal-3600數據集上創造了新的最先進水平
零樣本學習能力
無需特定任務的微調即可執行圖像分類任務

模型能力

零樣本圖像分類
跨模態檢索
多語言文本理解
圖像-文本匹配

使用案例

圖像檢索
多語言圖像搜索
使用不同語言查詢檢索相關圖像
在Crossmodal-3600數據集上達到62.54%的圖像檢索準確率
文本檢索
圖像相關文本檢索
根據圖像內容檢索相關文本描述
在Crossmodal-3600數據集上達到59.99%的文本檢索準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase