E

Eva02 Large Patch14 224.mim M38m

Developed by timm
EVA02特徵/表示模型,通過掩碼圖像建模在Merged-38M數據集上預訓練,適用於圖像分類和特徵提取任務。
Downloads 571
Release Time : 3/31/2023

Model Overview

EVA-02模型採用視覺Transformer架構,包含均值池化、SwiGLU激活函數、旋轉位置嵌入(ROPE)以及MLP中額外的層歸一化,主要用於圖像分類和特徵提取。

Model Features

大規模預訓練
在Merged-38M數據集(包含IN-22K、CC12M、CC3M、COCO等)上通過掩碼圖像建模進行預訓練。
高效架構
採用視覺Transformer架構,包含均值池化、SwiGLU激活函數、旋轉位置嵌入(ROPE)以及MLP中額外的層歸一化。
高性能
在ImageNet-1k上表現出色,Top1準確率達到89.57%。

Model Capabilities

圖像分類
圖像特徵提取

Use Cases

計算機視覺
圖像分類
用於對圖像進行分類,支持多種類別識別。
Top1準確率89.57%,Top5準確率98.918%。
特徵提取
提取圖像的深層特徵,可用於下游任務如目標檢測、圖像分割等。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase