A

Aimv2 Large Patch14 224

appleによって開発
AIMv2はマルチモーダル自己回帰目標で事前学習された視覚モデルシリーズで、多くの視覚タスクで優れた性能を発揮します。
ダウンロード数 759
リリース時間 : 10/29/2024

モデル概要

AIMv2はマルチモーダル自己回帰事前学習手法を採用し、強力な画像特徴抽出能力を持ち、様々な視覚分類タスクに適しています。

モデル特徴

マルチモーダル自己回帰事前学習
革新的なマルチモーダル自己回帰目標を用いた事前学習により、モデル性能を向上
卓越した分類性能
複数のベンチマークデータセットで最先端の分類精度を達成
強力な拡張性
シンプルで直接的な事前学習手法により、トレーニング規模を効果的に拡張可能

モデル能力

画像特徴抽出
画像分類
マルチモーダル理解

使用事例

コンピュータビジョン
汎用画像分類
ImageNetなどの汎用画像データセットでの分類
ImageNet-1k精度86.6%
細粒度分類
stanford-carsなどの細粒度分類タスクへの応用
stanford-cars精度96.3%
医療画像分析
camelyon17などの医療画像データセットへの応用
camelyon17精度93.7%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase