EVA02 CLIP開源視覺-語言模型 - 免費部署支持零樣本圖像分類任務

Home

Eva02 Large Patch14 Clip 336.merged2b

Developed by timm

EVA02 CLIP 是一個基於 CLIP 架構的大規模視覺-語言模型，支持零樣本圖像分類等任務。

文本生成圖像

Safetensors

Open Source License:MIT #零樣本圖像分類 #高分辨率視覺編碼 #多模態對比學習

Downloads 197

Release Time : 12/26/2024

Model Overview

該模型是基於 EVA02 和 CLIP 架構的視覺-語言模型，能夠理解圖像和文本之間的關係，適用於多種跨模態任務。

Model Features

零樣本學習能力

無需特定任務的微調即可執行圖像分類等任務

跨模態理解

能夠同時處理和理解視覺和文本信息

大規模預訓練

基於大量圖像-文本對進行預訓練，具有強大的泛化能力

Model Capabilities

零樣本圖像分類

圖像-文本匹配

跨模態檢索

Use Cases

計算機視覺

圖像分類

無需訓練即可對圖像進行分類

在多個基準測試中表現優異

圖像檢索

根據文本描述檢索相關圖像

內容審核

不良內容檢測

識別圖像中的不當內容

Featured Recommended AI Models

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers Supports Multiple Languages

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統 Chinese

uer

2,694

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

Eva02 Large Patch14 Clip 336.merged2b

Model Overview

Model Features

Model Capabilities

Use Cases

🚀 eva02_large_patch14_clip_336.merged2b模型卡片

🚀 快速開始

📄 許可證