E

Eva02 Tiny Patch14 224.mim In22k

由timm開發
EVA02是一個視覺Transformer模型,通過掩碼圖像建模在ImageNet-22k上預訓練,適用於圖像分類和特徵提取任務。
下載量 385
發布時間 : 3/31/2023

模型概述

EVA02模型是視覺Transformer,具有均值池化、SwiGLU、旋轉位置嵌入(ROPE)等技術,適用於圖像分類和特徵提取。

模型特點

掩碼圖像建模預訓練
使用EVA-CLIP作為MIM教師進行預訓練,提高了模型的表示能力。
高效架構設計
採用均值池化、SwiGLU激活函數和旋轉位置嵌入(ROPE)等技術,優化了模型性能。
輕量級模型
僅有5.5百萬參數,適合資源受限的環境。

模型能力

圖像分類
圖像特徵提取
視覺表示學習

使用案例

計算機視覺
圖像分類
可用於對圖像進行分類,支持多種類別識別。
在ImageNet-22k上預訓練,具有較高的分類準確率。
特徵提取
可用於提取圖像的深層特徵,適用於下游任務如目標檢測、圖像檢索等。
提供高質量的圖像表示。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase