E

Eva02 Large Patch14 224.mim In22k

timmによって開発
EVA02特徴/表現モデル、マスク画像モデリングによりImageNet-22kで事前学習され、視覚Transformerアーキテクチャを採用し、画像分類と特徴抽出タスクに適しています。
ダウンロード数 280
リリース時間 : 3/31/2023

モデル概要

EVA-02モデルは視覚Transformerアーキテクチャに基づく画像特徴抽出モデルで、マスク画像モデリング(MIM)によりImageNet-22kデータセットで事前学習され、画像分類と特徴埋め込みタスクをサポートします。

モデル特徴

マスク画像モデリング事前学習
EVA-CLIPをMIM教師モデルとして使用して事前学習を行い、モデルの特徴抽出能力を向上させました。
最適化されたTransformerアーキテクチャ
平均プーリング、SwiGLU活性化関数、回転位置埋め込み(ROPE)などの技術を採用し、モデル性能を強化しました。
高精度特徴抽出
ImageNet-22kなどの大規模データセットで事前学習され、高品質な画像特徴を抽出できます。

モデル能力

画像分類
画像特徴抽出
視覚表現学習

使用事例

コンピュータビジョン
画像分類
事前学習モデルを使用して画像を分類し、複数のカテゴリ認識をサポートします。
ImageNet-1kで高精度を達成(性能比較表を参照)。
特徴埋め込み
画像の特徴ベクトルを抽出し、物体検出、画像検索などの下流タスクに使用します。
高品質な画像特徴表現を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase