N

Nllb Clip Base Oc

由visheratin開發
NLLB-CLIP是一個結合NLLB文本編碼器與CLIP圖像編碼器的多語言視覺語言模型,支持201種語言
下載量 371
發布時間 : 10/7/2023

模型概述

該模型將NLLB模型的文本編碼能力與CLIP的圖像編碼能力相結合,擴展了多語言視覺語言理解能力,特別在低資源語言上表現優異

模型特點

多語言支持
支持Flores-200的201種語言,包括許多低資源語言
跨模態理解
結合文本和圖像編碼能力,實現視覺語言對齊
低資源語言優化
在低資源語言上取得了最先進的成果

模型能力

多語言圖像分類
跨模態檢索
零樣本學習

使用案例

多語言內容理解
多語言圖像標註
為圖像生成多種語言的描述標籤
在Crossmodal-3600數據集上表現優異
跨語言圖像搜索
使用不同語言查詢檢索相關圖像
低資源語言應用
低資源語言圖像分類
對低資源語言環境中的圖像進行分類
在低資源語言上達到SOTA性能
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase