E

Eva02 Large Patch14 224.mim In22k

Developed by timm
EVA02特徴/表現モデル、マスク画像モデリングによりImageNet-22kで事前学習され、視覚Transformerアーキテクチャを採用し、画像分類と特徴抽出タスクに適しています。
Downloads 280
Release Time : 3/31/2023

Model Overview

EVA-02モデルは視覚Transformerアーキテクチャに基づく画像特徴抽出モデルで、マスク画像モデリング(MIM)によりImageNet-22kデータセットで事前学習され、画像分類と特徴埋め込みタスクをサポートします。

Model Features

マスク画像モデリング事前学習
EVA-CLIPをMIM教師モデルとして使用して事前学習を行い、モデルの特徴抽出能力を向上させました。
最適化されたTransformerアーキテクチャ
平均プーリング、SwiGLU活性化関数、回転位置埋め込み(ROPE)などの技術を採用し、モデル性能を強化しました。
高精度特徴抽出
ImageNet-22kなどの大規模データセットで事前学習され、高品質な画像特徴を抽出できます。

Model Capabilities

画像分類
画像特徴抽出
視覚表現学習

Use Cases

コンピュータビジョン
画像分類
事前学習モデルを使用して画像を分類し、複数のカテゴリ認識をサポートします。
ImageNet-1kで高精度を達成(性能比較表を参照)。
特徴埋め込み
画像の特徴ベクトルを抽出し、物体検出、画像検索などの下流タスクに使用します。
高品質な画像特徴表現を生成します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase