E

Eva02 Large Patch14 224.mim In22k

由timm開發
EVA02特徵/表示模型,通過掩碼圖像建模在ImageNet-22k上預訓練,採用視覺Transformer架構,適用於圖像分類和特徵提取任務。
下載量 280
發布時間 : 3/31/2023

模型概述

EVA-02模型是一款基於視覺Transformer架構的圖像特徵提取模型,通過掩碼圖像建模(MIM)在ImageNet-22k數據集上預訓練,支持圖像分類和特徵嵌入任務。

模型特點

掩碼圖像建模預訓練
使用EVA-CLIP作為MIM教師模型進行預訓練,提升了模型的特徵提取能力。
優化的Transformer架構
採用均值池化、SwiGLU激活函數、旋轉位置嵌入(ROPE)等技術,增強了模型性能。
高精度特徵提取
在ImageNet-22k等大規模數據集上預訓練,能夠提取高質量的圖像特徵。

模型能力

圖像分類
圖像特徵提取
視覺表示學習

使用案例

計算機視覺
圖像分類
使用預訓練模型對圖像進行分類,支持多種類別識別。
在ImageNet-1k上達到高準確率(參見性能比較表)。
特徵嵌入
提取圖像的特徵向量,用於下游任務如目標檢測、圖像檢索等。
生成高質量的圖像特徵表示。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase