nllb-clip-large-oc开源多语言视觉语言模型 - 支持201种语言，文本图像联动

首页

Nllb Clip Large Oc

由 visheratin 开发

NLLB-CLIP是一个结合NLLB模型文本编码器与CLIP图像编码器的多语言视觉语言模型，支持201种语言。

文本生成图像 #多语言零样本分类 #低资源语言优化 #跨模态图像理解

下载量 28

发布时间 : 10/7/2023

模型简介

该模型结合了NLLB的文本编码能力和CLIP的图像编码能力，扩展了对Flores-200的201种语言的支持，特别在低资源语言上表现优异。

模型特点

多语言支持

支持Flores-200的201种语言，特别在低资源语言上表现优异。

跨模态能力

结合文本和图像编码能力，实现零样本图像分类。

高性能

在Crossmodal-3600数据集上树立了新的技术标杆。

模型能力

零样本图像分类

多语言文本理解

跨模态检索

使用案例

多语言图像分类

多语言图像标注

使用支持的多语言对图像进行分类和标注。

在低资源语言上表现优异。

跨模态检索

图像-文本匹配

在多语言环境下匹配图像和文本描述。

属性	详情
模型类型	零样本图像分类模型
训练数据	visheratin/laion - coco - nllb

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Nllb Clip Large Oc

模型简介

模型特点

模型能力

使用案例

🚀 NLLB - CLIP 模型

🚀 快速开始

模型概述

致谢

📄 许可证