N

Nllb Clip Base Oc

由 visheratin 开发
NLLB-CLIP是一个结合NLLB文本编码器与CLIP图像编码器的多语言视觉语言模型,支持201种语言
下载量 371
发布时间 : 10/7/2023

模型简介

该模型将NLLB模型的文本编码能力与CLIP的图像编码能力相结合,扩展了多语言视觉语言理解能力,特别在低资源语言上表现优异

模型特点

多语言支持
支持Flores-200的201种语言,包括许多低资源语言
跨模态理解
结合文本和图像编码能力,实现视觉语言对齐
低资源语言优化
在低资源语言上取得了最先进的成果

模型能力

多语言图像分类
跨模态检索
零样本学习

使用案例

多语言内容理解
多语言图像标注
为图像生成多种语言的描述标签
在Crossmodal-3600数据集上表现优异
跨语言图像搜索
使用不同语言查询检索相关图像
低资源语言应用
低资源语言图像分类
对低资源语言环境中的图像进行分类
在低资源语言上达到SOTA性能
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase