E

Eva02 Tiny Patch14 224.mim In22k

timmによって開発
EVA02は視覚Transformerモデルで、マスク画像モデリングによりImageNet-22kで事前学習されており、画像分類や特徴抽出タスクに適しています。
ダウンロード数 385
リリース時間 : 3/31/2023

モデル概要

EVA02モデルは視覚Transformerで、平均プーリング、SwiGLU、回転位置埋め込み(ROPE)などの技術を備え、画像分類や特徴抽出に適しています。

モデル特徴

マスク画像モデリング事前学習
EVA-CLIPをMIM教師として使用した事前学習により、モデルの表現能力が向上しました。
効率的なアーキテクチャ設計
平均プーリング、SwiGLU活性化関数、回転位置埋め込み(ROPE)などの技術を採用し、モデル性能を最適化しました。
軽量級モデル
わずか550万パラメータで、リソースが限られた環境に適しています。

モデル能力

画像分類
画像特徴抽出
視覚表現学習

使用事例

コンピュータビジョン
画像分類
画像を分類するために使用でき、複数のカテゴリ認識をサポートします。
ImageNet-22kで事前学習されており、高い分類精度を有します。
特徴抽出
画像の深層特徴を抽出するために使用でき、物体検出や画像検索などの下流タスクに適しています。
高品質な画像表現を提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase