N

Nllb Clip Large Siglip

由visheratin開發
NLLB-CLIP-SigLIP是一個結合了NLLB模型的文本編碼器和SigLIP模型的圖像編碼器的多語言視覺語言模型,支持201種語言。
下載量 384
發布時間 : 11/14/2023

模型概述

該模型結合了NLLB的文本編碼能力和SigLIP的圖像編碼能力,特別擅長低資源語言的跨模態任務,在Crossmodal-3600數據集上表現優異。

模型特點

多語言支持
支持Flores-200的201種語言,包括許多低資源語言
跨模態能力
結合文本和圖像編碼能力,擅長圖像-文本匹配任務
低資源語言表現
在低資源語言上達到最先進水平

模型能力

多語言圖像分類
跨語言圖像檢索
零樣本學習

使用案例

多語言內容理解
多語言圖像分類
使用不同語言的文本標籤對圖像進行分類
在Crossmodal-3600數據集上表現優異
跨語言圖像檢索
使用不同語言查詢檢索相關圖像
支持201種語言的查詢
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase