N

Nllb Clip Large Oc

由visheratin開發
NLLB-CLIP是一個結合NLLB模型文本編碼器與CLIP圖像編碼器的多語言視覺語言模型,支持201種語言。
下載量 28
發布時間 : 10/7/2023

模型概述

該模型結合了NLLB的文本編碼能力和CLIP的圖像編碼能力,擴展了對Flores-200的201種語言的支持,特別在低資源語言上表現優異。

模型特點

多語言支持
支持Flores-200的201種語言,特別在低資源語言上表現優異。
跨模態能力
結合文本和圖像編碼能力,實現零樣本圖像分類。
高性能
在Crossmodal-3600數據集上樹立了新的技術標杆。

模型能力

零樣本圖像分類
多語言文本理解
跨模態檢索

使用案例

多語言圖像分類
多語言圖像標註
使用支持的多語言對圖像進行分類和標註。
在低資源語言上表現優異。
跨模態檢索
圖像-文本匹配
在多語言環境下匹配圖像和文本描述。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase