A

Aimv2 Large Patch14 448

appleによって開発
AIMv2はマルチモーダル自己回帰目標事前学習に基づく視覚モデルシリーズで、複数のベンチマークテストで優れた性能を発揮
ダウンロード数 2,210
リリース時間 : 10/29/2024

モデル概要

AIMv2はマルチモーダル自己回帰目標で事前学習され、画像分類、物体検出などの視覚タスクで強力な性能を発揮

モデル特徴

マルチモーダル自己回帰事前学習
革新的なマルチモーダル自己回帰目標で事前学習し、モデルの理解能力を向上
卓越した性能
複数のベンチマークテストでCLIP、SigLIP、DINOv2などの主流視覚モデルを凌駕
大規模拡張能力
事前学習方法がシンプルで直接的であり、トレーニング規模を効果的に拡張可能

モデル能力

画像特徴抽出
画像分類
マルチモーダル理解
オープン語彙物体検出
指示表現理解

使用事例

コンピュータビジョン
画像分類
ImageNetなどのデータセットで画像分類タスクを実行
ImageNet-1kで87.9%の精度を達成
細粒度分類
特定ドメインの細粒度画像分類タスク
Stanford Carsで96.6%の精度を達成
医療画像分析
医療画像分類タスクを処理
Camelyon17で94.1%の精度を達成
リモートセンシング画像処理
衛星画像分類
衛星および航空画像分類タスクを処理
EuroSATで98.6%の精度を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase