E

Eva02 Large Patch14 224.mim M38m

由timm開發
EVA02特徵/表示模型,通過掩碼圖像建模在Merged-38M數據集上預訓練,適用於圖像分類和特徵提取任務。
下載量 571
發布時間 : 3/31/2023

模型概述

EVA-02模型採用視覺Transformer架構,包含均值池化、SwiGLU激活函數、旋轉位置嵌入(ROPE)以及MLP中額外的層歸一化,主要用於圖像分類和特徵提取。

模型特點

大規模預訓練
在Merged-38M數據集(包含IN-22K、CC12M、CC3M、COCO等)上通過掩碼圖像建模進行預訓練。
高效架構
採用視覺Transformer架構,包含均值池化、SwiGLU激活函數、旋轉位置嵌入(ROPE)以及MLP中額外的層歸一化。
高性能
在ImageNet-1k上表現出色,Top1準確率達到89.57%。

模型能力

圖像分類
圖像特徵提取

使用案例

計算機視覺
圖像分類
用於對圖像進行分類,支持多種類別識別。
Top1準確率89.57%,Top5準確率98.918%。
特徵提取
提取圖像的深層特徵,可用於下游任務如目標檢測、圖像分割等。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase