eva02_enormous_patch14_clip_224.laion2b_s4b_b115k開源視覺 - 語言模型，免費實現零樣本圖像分類

Home

Eva02 Enormous Patch14 Clip 224.laion2b S4b B115k

Developed by timm

基於EVA02架構的大規模視覺-語言模型，支持零樣本圖像分類任務

文本生成圖像

Safetensors

Open Source License:MIT #零樣本圖像分類 #多模態對比學習 #大規模預訓練

Downloads 130

Release Time : 4/10/2023

Model Overview

該模型是基於CLIP框架的視覺-語言預訓練模型，採用EVA02架構，能夠理解圖像和文本的關聯，適用於零樣本圖像分類等跨模態任務。

Model Features

零樣本學習能力

無需特定任務的微調即可執行圖像分類任務

大規模預訓練

在LAION-2B等大規模數據集上預訓練

跨模態理解

能夠同時處理和理解視覺和文本信息

Model Capabilities

零樣本圖像分類

圖像-文本匹配

跨模態檢索

Use Cases

內容理解與檢索

智能圖像搜索

使用自然語言描述搜索相關圖像

高精度的跨模態檢索效果

自動圖像標註

為圖像生成描述性標籤

無需訓練即可生成相關標籤

教育研究

視覺概念學習

研究視覺和語言概念的關聯表示

為認知科學研究提供工具

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Eva02 Enormous Patch14 Clip 224.laion2b S4b B115k

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 eva02_enormous_patch14_clip_224.laion2b_s4b_b115k

🚀 快速開始

📄 許可證