E

Eva02 Large Patch14 224.mim M38m

timmによって開発
EVA02特徴/表現モデル、マスク画像モデリングによりMerged-38Mデータセットで事前学習済み、画像分類と特徴抽出タスクに適しています。
ダウンロード数 571
リリース時間 : 3/31/2023

モデル概要

EVA-02モデルは視覚Transformerアーキテクチャを採用し、平均プーリング、SwiGLU活性化関数、回転位置埋め込み(ROPE)、およびMLP内の追加のレイヤー正規化を含み、主に画像分類と特徴抽出に使用されます。

モデル特徴

大規模事前学習
Merged-38Mデータセット(IN-22K、CC12M、CC3M、COCOなどを含む)でマスク画像モデリングによる事前学習を実施。
効率的なアーキテクチャ
視覚Transformerアーキテクチャを採用し、平均プーリング、SwiGLU活性化関数、回転位置埋め込み(ROPE)、およびMLP内の追加のレイヤー正規化を含みます。
高性能
ImageNet-1kで優れた性能を発揮し、Top1精度89.57%を達成。

モデル能力

画像分類
画像特徴抽出

使用事例

コンピュータビジョン
画像分類
画像を分類するために使用され、複数のカテゴリ認識をサポートします。
Top1精度89.57%、Top5精度98.918%。
特徴抽出
画像の深層特徴を抽出し、物体検出、画像セグメンテーションなどの下流タスクに利用可能です。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase