A

Aimv2 Huge Patch14 448

appleによって開発
AIMv2はマルチモーダル自己回帰目標で事前学習された視覚モデルシリーズで、複数のベンチマークテストで優れた性能を発揮します。
ダウンロード数 1,672
リリース時間 : 10/29/2024

モデル概要

AIMv2は効率的な視覚モデルで、マルチモーダル自己回帰目標を用いた事前学習を行い、画像分類や特徴抽出などのタスクで優れた性能を示します。

モデル特徴

マルチモーダル自己回帰事前学習
革新的なマルチモーダル自己回帰目標を用いた事前学習により、モデル性能を向上
卓越したベンチマーク性能
CLIP、SigLIP、DINOv2などのモデルを凌駕する複数の視覚ベンチマークでの性能
強力な認識能力
ImageNetで89.5%の精度を達成し、優れた認識性能を発揮

モデル能力

画像特徴抽出
画像分類
マルチモーダル理解
オープン語彙物体検出
指示表現理解

使用事例

コンピュータビジョン
画像分類
画像を分類・識別
ImageNet-1kで88.6%の精度
自然画像認識
自然シーン中の物体を認識
iNaturalist-18で82.8%の精度
細粒度分類
細粒度物体分類を実施
Stanford Carsで96.5%の精度
医療画像
病理画像分析
医療病理画像を分析
Camelyon17で93.4%の精度
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase