A

Aimv2 3B Patch14 448

appleによって開発
AIMv2はマルチモーダル自己回帰目標で事前学習された視覚モデルシリーズで、複数の視覚理解ベンチマークで優れた性能を発揮します。
ダウンロード数 161
リリース時間 : 10/29/2024

モデル概要

AIMv2シリーズの視覚モデルはマルチモーダル自己回帰目標で事前学習されており、強力な画像特徴抽出と分類能力を持ち、複数のベンチマークで同類のモデルを上回ります。

モデル特徴

マルチモーダル自己回帰事前学習
マルチモーダル自己回帰目標を用いた事前学習により、モデル性能を効果的に向上させます。
卓越した分類性能
OpenAI CLIP、SigLIP、DINOv2などのモデルを複数のベンチマークで上回ります。
大規模パラメータ
3Bパラメータのモデル規模で、強力な特徴抽出能力を備えています。

モデル能力

画像特徴抽出
画像分類
マルチモーダル理解

使用事例

コンピュータビジョン
画像分類
ImageNetなどのデータセットで高精度な画像分類を行います。
ImageNet-1k精度89.5%
細粒度分類
stanford-carsなどの細粒度分類タスクで優れた性能を発揮します。
stanford-cars精度96.7%
医療画像
病理画像分析
camelyon17などの医療画像データセットで分類を行います。
camelyon17精度93.4%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase