N

Nllb Siglip Mrl Large

由visheratin開發
NLLB-SigLIP-MRL 是一個結合了NLLB模型的文本編碼器和SigLIP模型的圖像編碼器的多語言視覺-語言模型,支持Flores-200的201種語言。
下載量 297
發布時間 : 3/4/2024

模型概述

該模型結合了NLLB的文本編碼能力和SigLIP的圖像編碼能力,通過Matryoshka表示學習訓練,支持多種嵌入尺寸,在多語言圖像和文本檢索任務上達到最先進水平。

模型特點

多語言支持
支持Flores-200的201種語言,擴展了模型的多語言能力。
可變嵌入尺寸
支持[32, 64, 128, 256, 512]等多種嵌入尺寸,256和512尺寸保留了90%以上的完整嵌入質量。
最先進性能
在XTD10和Crossmodal-3600數據集上為多語言圖像和文本檢索設定了新的最先進水平。

模型能力

多語言圖像分類
多語言文本檢索
多語言圖像檢索
零樣本學習

使用案例

多語言內容檢索
跨語言圖像搜索
使用不同語言的文本查詢檢索相關圖像
在Crossmodal-3600數據集上圖像檢索R@1達到0.6079
多語言圖像分類
使用不同語言的標籤對圖像進行分類
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase