E

Eva02 Small Patch14 224.mim In22k

timmによって開発
EVA02特徴/表現モデル、マスク画像モデリングによりImageNet-22kで事前学習され、画像分類と特徴抽出タスクに適しています。
ダウンロード数 705
リリース時間 : 3/31/2023

モデル概要

EVA-02モデルは視覚Transformerで、平均プーリング、SwiGLU、回転位置埋め込み(ROPE)などの技術を備え、画像分類と特徴抽出タスクに適しています。

モデル特徴

マスク画像モデリング事前学習
EVA-CLIPをMIM教師としてImageNet-22kで事前学習を行い、モデルの表現能力を向上させました。
先進的なTransformerアーキテクチャ
平均プーリング、SwiGLU、回転位置埋め込み(ROPE)などの技術を採用し、モデル性能を向上させました。
効率的な計算
パラメータ数は2160万、GMACsは6.1で、リソースが限られた環境での展開に適しています。

モデル能力

画像特徴抽出
画像分類

使用事例

コンピュータビジョン
画像分類
画像を分類するために使用され、複数のカテゴリ認識をサポートします。
ImageNet-22kで事前学習されており、高い分類精度を持っています。
特徴抽出
画像の特徴表現を抽出し、物体検出、画像検索などの下流タスクに使用できます。
高品質な画像特徴表現を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase