A

Aimv2 3B Patch14 336

appleによって開発
AIMv2はマルチモーダル自己回帰目標で事前学習された視覚モデルシリーズで、複数のマルチモーダル理解ベンチマークで優れた性能を発揮します。
ダウンロード数 23
リリース時間 : 10/29/2024

モデル概要

AIMv2は効率的な視覚モデルで、マルチモーダル自己回帰目標による事前学習を行い、画像分類や物体検出などのタスクで優れた性能を示します。

モデル特徴

マルチモーダル自己回帰事前学習
マルチモーダル自己回帰目標を用いた事前学習により、モデルの理解能力を向上
高性能
CLIP、SigLIP、DINOv2などのモデルを上回る複数のベンチマークテスト結果
大規模スケーリング能力
シンプルで直接的な事前学習方法により、トレーニング規模を効果的に拡張可能

モデル能力

画像特徴抽出
画像分類
オープン語彙物体検出
指示表現理解

使用事例

コンピュータビジョン
画像分類
ImageNetなどのデータセットで高精度な画像分類を実現
ImageNet-1k精度89.2%
細粒度分類
stanford-carsなどの特定領域データセットでの分類
stanford-cars精度96.6%
医療画像
病理画像解析
camelyon17などの医療画像データセットでの解析
camelyon17精度93.2%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase