nllb-clip-base-oc开源多语言视觉语言模型 - 免费支持201种语言图文结合应用

首页

Nllb Clip Base Oc

由 visheratin 开发

NLLB-CLIP是一个结合NLLB文本编码器与CLIP图像编码器的多语言视觉语言模型，支持201种语言

文本生成图像 #多语言零样本分类 #低资源语言优化 #跨模态检索

下载量 371

发布时间 : 10/7/2023

模型简介

该模型将NLLB模型的文本编码能力与CLIP的图像编码能力相结合，扩展了多语言视觉语言理解能力，特别在低资源语言上表现优异

模型特点

多语言支持

支持Flores-200的201种语言，包括许多低资源语言

跨模态理解

结合文本和图像编码能力，实现视觉语言对齐

低资源语言优化

在低资源语言上取得了最先进的成果

模型能力

多语言图像分类

跨模态检索

零样本学习

使用案例

多语言内容理解

多语言图像标注

为图像生成多种语言的描述标签

在Crossmodal-3600数据集上表现优异

跨语言图像搜索

使用不同语言查询检索相关图像

低资源语言应用

低资源语言图像分类

对低资源语言环境中的图像进行分类

在低资源语言上达到SOTA性能

属性	详情
模型类型	结合NLLB文本编码器与CLIP图像编码器的跨模态模型
训练数据	visheratin/laion - coco - nllb

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Nllb Clip Base Oc

模型简介

模型特点

模型能力

使用案例

🚀 NLLB - CLIP模型

🚀 快速开始

📄 许可证

👏 致谢