N

Nllb Clip Large Oc

由 visheratin 开发
NLLB-CLIP是一个结合NLLB模型文本编码器与CLIP图像编码器的多语言视觉语言模型,支持201种语言。
下载量 28
发布时间 : 10/7/2023

模型简介

该模型结合了NLLB的文本编码能力和CLIP的图像编码能力,扩展了对Flores-200的201种语言的支持,特别在低资源语言上表现优异。

模型特点

多语言支持
支持Flores-200的201种语言,特别在低资源语言上表现优异。
跨模态能力
结合文本和图像编码能力,实现零样本图像分类。
高性能
在Crossmodal-3600数据集上树立了新的技术标杆。

模型能力

零样本图像分类
多语言文本理解
跨模态检索

使用案例

多语言图像分类
多语言图像标注
使用支持的多语言对图像进行分类和标注。
在低资源语言上表现优异。
跨模态检索
图像-文本匹配
在多语言环境下匹配图像和文本描述。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase