N

Nllb Clip Base Siglip

由 visheratin 开发
NLLB-CLIP-SigLIP 是一个结合了NLLB模型的文本编码器和SigLIP模型的图像编码器的多语言视觉语言模型,支持201种语言。
下载量 478
发布时间 : 11/14/2023

模型简介

该模型结合了NLLB的文本编码能力和SigLIP的图像编码能力,特别擅长处理低资源语言,在跨模态任务中表现出色。

模型特点

多语言支持
支持Flores-200的201种语言,特别擅长处理低资源语言
跨模态能力
结合了文本和图像编码能力,适用于跨模态任务
性能优越
在Crossmodal-3600数据集上设定了最新的技术水平

模型能力

零样本图像分类
多语言文本理解
跨模态检索

使用案例

多语言应用
多语言图像分类
使用不同语言对图像进行分类
在多种语言上表现出色
跨模态检索
图文匹配
在多语言环境下匹配图像和文本
在Crossmodal-3600数据集上表现优异
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase