E

Eva02 Small Patch14 224.mim In22k

由timm開發
EVA02特徵/表示模型,通過掩碼圖像建模在ImageNet-22k上預訓練,適用於圖像分類和特徵提取任務。
下載量 705
發布時間 : 3/31/2023

模型概述

EVA-02模型是視覺Transformer,具有均值池化、SwiGLU、旋轉位置嵌入(ROPE)等技術,適用於圖像分類和特徵提取任務。

模型特點

掩碼圖像建模預訓練
使用EVA-CLIP作為MIM教師在ImageNet-22k上進行預訓練,提高了模型的表徵能力。
先進的Transformer架構
採用均值池化、SwiGLU、旋轉位置嵌入(ROPE)等技術,提升了模型性能。
高效計算
參數量為21.6百萬,GMACs為6.1,適合在資源有限的環境下部署。

模型能力

圖像特徵提取
圖像分類

使用案例

計算機視覺
圖像分類
用於對圖像進行分類,支持多種類別識別。
在ImageNet-22k上預訓練,具有較高的分類準確率。
特徵提取
提取圖像的特徵表示,可用於下游任務如目標檢測、圖像檢索等。
提供高質量的圖像特徵表示。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase