CLIP-Giga-config-fixed开源模型 - 支持图文跨模态理解，免费助力内容分析

Home

CLIP Giga Config Fixed

Developed by Geonmo

基于LAION-2B数据集训练的CLIP大模型，采用ViT-bigG-14架构，支持图文跨模态理解

文本生成图像

Transformers

Open Source License:MIT #多模态理解 #零样本分类 #大规模预训练

Downloads 109

Release Time : 6/28/2023

Model Overview

这是一个大规模视觉-语言预训练模型，能够将图像和文本映射到同一语义空间，实现跨模态检索和理解

Model Features

大规模预训练

使用39B token的LAION-2B数据集训练，具有强大的跨模态理解能力

高效视觉编码

采用ViT-bigG-14架构，能高效处理高分辨率图像输入

零样本迁移能力

无需微调即可应用于下游任务，如图文检索和零样本分类

Model Capabilities

图文相似度计算

跨模态检索

零样本图像分类

图像描述生成

文本引导图像搜索

Use Cases

内容检索

电商产品搜索

通过文字描述搜索相关产品图片

提高搜索准确率和用户体验

内容审核

违规内容检测

通过图文匹配检测违规内容

自动化内容审核流程

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

CLIP Giga Config Fixed

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 项目说明

📄 许可证